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Capitulo  1 


Conceptos  Basicos 


[LP81,  cap  1] 

En  este  capitulo  repasaremos  brevemente  conceptos  elementales  que  el  lector  ya  debiera 
conocer,  y  luego  intro duciremos  elementos  mas  relacionados  con  la  materia.  La  mayoria  de 
las  definiciones,  lemas,  etc.  de  este  capitulo  no  estan  indexados  en  el  Indice  de  Materias 
al  final  del  apunte,  pues  son  demasiado  basicos.  Indexamos  solo  lo  que  se  refiere  al  tenia 
especlfico  de  lcnguajes  formales,  complejidad,  y  computabilidad. 

No  repasaremos  el  lenguaje  de  la  logica  de  predicados  de  primer  orden,  que  usaremos 
directamente,  ni  nada  sobre  numeros. 


1.1  Induccion  Estructural 

En  muchas  demostraeiones  del  curso  haremos  induccion  sobre  estructuras  definidas 
recursivamente.  La  induccion  natural  que  se  supone  que  el  lector  ya  conoce,  (P(0)  A  ( P(n )  =>■ 
P(n  +  1))  Vn  >  0,  P(n)),  puede  extenderse  a  estas  estructuras  recursivas.  Esencialmente 
lo  que  se  haee  es  aplicar  induccion  natural  sobre  alguna  propiedad  de  la  estructura  (como  su 
tamano),  de  modo  que  pueda  suponerse  que  la  propiedad  vale  para  todas  sus  subestructuras. 

Veamos  un  ejemplo.  Lin  arbol  binario  es  o  bien  un  nodo  hoja  o  bien  un  nodo  interno  del 
que  cuelgan  dos  arboles  binarios.  Llamemos  i(A)  y  h(A )  a  la  cantidad  de  nodos  internos  y 
nodos  hojas,  respectivamente,  de  un  arbol  binario  A.  Demostremos  por  induccion  estructural 
que,  para  todo  arbol  binario  A,  i(A )  =  h(A )  —  1. 

Caso  base:  Si  el  arbol  A  es  un  nodo  hoja,  entonces  tiene  cero  nodos  internos  y  una  hoja, 
y  la  proposition  vale  pues  i(A)  =  0  y  h(A)  =  1. 

Caso  inductivo:  Si  el  arbol  A  es  un  nodo  interno  del  que  cuelgan  subarboles  Ax  y  A2, 
tenemos  por  hipotesis  inductiva  que  i(Ai)  =  h(Ai)  —  1  y  i(A2)  =  h(A2)  —  1.  Ahora  bien, 
los  nodos  de  A  son  los  de  Ai,  los  de  A2,  y  un  nuevo  nodo  interno.  De  modo  que  i(A )  = 
i{Ai)  +  i{A2)  +  1  y  h(A)  =  h(Ai)  +  h(A2).  De  aquf  que  i{A)  =  h(Ai)  —  1  +  h(A2)  —  1  +  1  = 
h(A\)  +  h(A2)  —  1  =  h(A)  —  1  y  hemos  terminado. 
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1.2  Conjuntos,  Relaciones  y  Funciones 

Definicion  1.1  Un  conjunto  A  es  una  coleccion  finita  o  infinita  de  objetos.  Se  dice  que  esos 
objetos  pertenecen  al  conjunto,  x  E  A.  Una  condicion  logica  equivale?ite  a  x  E  A  define  el 
conjunto  A. 

Definicion  1.2  El  conjunto  vatio,  denotado  0,  es  un  conjunto  sin  elementos. 

Definicion  1.3  Un  conjunto  B  es  subconjunto  de  un  conjunto  A,  B  C  A,  si  x  E  B  x  E 
A.  Si  ademas  B  A,  se  puede  decir  B  C  A. 

Definicion  1.4  El  conjunto  de  partes  de  un  conjunto  A,  p(A),  es  el  conjunto  de  todos  los 
subconjuntos  de  A,  es  decir  {A",  X  C  A}. 

Definicion  1.5  Algunas  operaciones  posibles  sobre  dos  conjuntos  A  y  B  son: 

1.  Union:  x  E  AU  B  sii  x  E  A  V  x  E  B. 

2.  Intersection:  x  E  An  B  sii  x  E  A  A  x  E  B . 

3.  Difcrencia:  x  E  A  —  B  sii  x  E  A  A  x  B . 

4 ■  Producto:  (x,y)  E  A  x  B  sii  x  E  A  Ay  E  B. 

Definicion  1.6  Una  partition  de  un  conjunto  A  es  un  conjunto  de  conjuntos  B\, . . .  Bn  tal 
que  A  =  Ui<i<n  Bi  V  Bi  n  Bj  =  0  para  todo  i  ^  j. 

Definicion  1.7  Una  relation  1Z  entre  dos  conjuntos  A  y  B,  es  un  subconjunto  de  Ax  B. 
Si  (a,  b)  ElZ  se  dice  tambien  aPZb. 

Definicion  1.8  Algunas  propiedades  que  puede  tener  una  relacion  TZ  C  A  x  A  son: 

•  Reflexividad:  Vo  E  A,  alZa. 

•  Simetria:  Va,  b  E  A,  aPZb  blZa. 

•  Transitividad:  Va,  b,c  E  A,  aPZb  A  blZc  aPZc. 

•  Antisimetrfa:  Va  ^  b  E  A,  aPZb  =>■  ->bTZa. 


Definicion  1.9  Algunos  tipos  de  relaciones,  segun  las  propiedades  que  cumplen,  son: 

•  de  Equivalencia:  Reflexiva,  simetrica  y  transitiva. 

•  de  Preorden:  Reflexiva  y  transitiva. 

•  de  Orden:  Reflexiva,  antisimetrica  y  transitiva. 
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Lema  1.1  Una  relacion  de  equivalencia  =  en  A  (o  sea  =  C  Ax  A)  particiona  A  en  clases 
de  equivalencia,  de  modo  que  a,  a'  G  A  estan  en  la  misma  clase  sii  a  =  a! .  Al  conjunto  de 
las  clases  de  equivalencia,  A/  =,  se  lo  llama  conjunto  cuociente. 

Definicion  1.10  Clausurar  una  relacion  IZ  C  A  x  A  es  agregarle  la  minima  cantidad  de 
elementos  necesaria  para  que  cumpla  una  cierta  propiedad. 

•  Clausura  reflexiva:  es  la  menor  relacion  reflexiva  que  contiene  IZ  (“menor”  en  sentido 
de  que  no  contiene  otra,  vista  como  conjunto).  Para  obtenerla  basta  incluir  todos  los 
pares  (a,  a),  a  G  A,  en  IZ. 

•  Clausura  transitiva:  es  la  menor  relacion  transitiva  que  contiene  IZ.  Para  obtenerla 
deben  incluirse  todos  los  pares  (a,  c)  tales  que  (a,  b)  G  IZ  y  (b,  c)  G  IZ.  Deben  considerarse 
tambien  los  nuevos  pares  que  se  van  agregando! 


Definicion  1.11  Una  funcion  /  :  A  — y  B  es  una  relacion  en  Ax  B  que  cumple  que  Va  G 
A,  3!  b  G  B ,  afb.  A  ese  unico  b  se  lo  llama  /(a).  A  se  llama  el  dominio  y  {/(a),  a  G  A}  C  B 
la  imagen  de  f . 

Definicion  1.12  Una  funcion  f  :  A  — y  B  es: 

•  inyectiva  si  a  ^  a'  =>■  /(a)  ^  /(a'). 

•  sobreyectiva  si  Vfe  G  B,  3a  G  A,  f(a )  =  b. 

•  biyectiva  si  es  inyectiva  y  sobreyectiva. 


1.3  Cardinalidad 

La  cardinalidad  de  un  conjunto  finito  es  simplemente  la  cantidad  de  elementos  que  tiene. 
Esto  es  mas  complejo  para  conjuntos  infinitos.  Deben  darse  nombres  especiales  a  estas 
cardinalidades,  y  no  todas  las  cardinalidades  infinitas  son  iguales. 

Definicion  1.13  La  cardinalidad  de  un  conjunto  A  se  escribe  |A|.  Si  A  es  finito,  entonces 
|A|  es  un  numero  natural  igual  a  la  cantidad  de  elementos  que  pertenecen  a  A. 

Definicion  1.14 

Se  dice  que  |A|  <  \B\  si  existe  una  funcion  f  :  A  — y  B  inyectiva. 

Se  dice  que  |A|  >  \B\  si  existe  una  funcion  f  :  A  — y  B  sobreyectiva. 

Se  dice  que  |A|  =  \B\  si  existe  una  funcion  f  :  A  — y  B  biyectiva. 

Se  dice  |3L|  <  \B\  si  |A|  <  \B\  y  no  vale  |A|  =  \B\;  similarmente  con  |A|  >  \B\. 
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Definicion  1.15  A  la  cardinalidad  de  N  se  la  llama  |N|  =  K0  (alef  sub  cero).  A  todo 
conjunto  de  cardinal  <  K0  se  le  dice  numerable. 

Observation  1.1  Un  conjunto  numerable  A,  por  definicion,  admite  una  sobreyeccion  f  : 
N  — *  A,  o  lo  que  es  lo  mismo,  es  posible  listar  los  elementos  de  A  en  orden  /( 0),  /( 1), 
/( 2),  . . .  de  manera  que  todo  elemento  de  A  se  mencione  alguna  vez.  De  modo  que  para 
demostrar  que  A  es  numerable  basta  exhibir  una  forma  de  listar  sus  elementos  y  mostrar  que 
todo  elemento  sera  listado  en  algun  momento. 

Teorema  1.1  K0  es  el  menor  cardinal  infinito.  Mas  precisamente,  todo  A  tal  que  |H|  <  K0 
cumple  que  |H|  es  finito  o  |H|  =  K0. 

Prueba:  Si  A  es  infinito,  entonces  \A\  >  n  para  cualquier  n  >  0.  Es  decir,  podemos  definir 

subconjuntos  An  C  A,  \An\  =  n,  para  cada  n  >  0,  de  modo  que  An_\  C  An.  Sea  an  el  unico 
elemento  de  An  —  An_ Entonces  todos  los  an  son  distintos  y  podemos  hacer  una  sobreyeccion  de 
{ai,  a2, . . .}  en  N.  □ 

Observacion  1.2  El  que  A  C  B  no  implica  que  |H|  <  \B\  en  conjuntos  infinitos.  Por 
ejemplo  el  conjunto  de  los  pares  es  del  mismo  cardinal  que  el  de  los  naturales,  mediante  la 
biyeccion  f(n)  =  2 n. 

Teorema  1.2  El  cardinal  de  p(N)  es  estrictamente  mayor  que  el  de  N. 

Prueba:  Es  facil  ver,  mediante  biyecciones,  que  los  siguientes  conjuntos  tienen  el  mismo  cardinal 
que  p(N): 

1.  Las  secuencias  infinitas  de  bits,  haciendo  la  biyeccion  con  p(N)  dada  por:  el  z-esimo  bit  es  1 
sii  i  —  1  pertenece  al  subconjunto. 

2.  Las  funciones  /  :  N  — »  {0, 1},  haciendo  la  biyeccion  con  el  punto  1;  F(f)  =  /(0)/(l)/(2) . . . 
es  una  secuencia  infinita  de  bits  que  describe  unfvocamente  a  /. 

3.  Los  numeros  reales  0  <  x  <  1:  basta  escribirlos  en  binario  de  la  forma  0.01101 . . . ,  para  tener 
la  biyeccion  con  las  secuencias  infinitas  de  bits.  Hay  algunas  sutilezas  debido  a  que  0.0011111 . . .  = 
0.0100000  . . ,,  pero  pueden  remediarse. 

4.  Los  reales  misrnos,  M,  mediante  alguna  funcion  biyectiva  con  [0, 1)  (punto  3).  Hay  varias 
funciones  trigonometricas,  corno  la  tangente,  que  sirven  facilmente  a  este  proposito. 

Utilizaremos  el  metodo  de  diagonalizacion  de  Cantor  para  demostrar  que  las  secuencias  infinitas 
de  bits  no  son  numerables.  Supondremos,  por  contradiction,  que  podemos  hacer  una  lista  de  todas 
las  secuencias  de  bits,  B\,  f?2,  B%,  . . .,  donde  Bi  es  la  i-esima  secuencia  y  Bfij)  es  el  j-esimo  bit 
de  Bi.  Definamos  ahora  la  secuencia  de  bits  X  =  Bi(l)  H2( 2)  . . .,  donde  0  =  1  y  1  =  0.  Como 
X(i)  =  Bfii)  A  Hj(z),  se  deduce  que  X  A  Bi  para  todo  Bi.  Entonces  X  es  una  secuencia  de  bits 
que  no  aparece  en  la  lista.  Para  cualquier  listado,  podemos  generar  un  elemento  que  no  aparece, 
por  lo  cual  no  puede  existir  un  listado  exhaustivo  de  todas  las  secuencias  infinitas  de  bits.  □ 
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Observacion  1.3  La  hipotesis  del  continuo  establece  que  no  existe  ningun  conjunto  X  tal 
que  |N|  <  |X|  <  |R|.  Se  ha  probado  que  esta  hipotesis  no  se  puede  probar  ni  refutar  con 
los  axiomas  usuales  de  la  teoria  de  conjuntos,  sino  que  es  necesario  introducirla  (o  a  su 
negacion)  como  un  axioma  adicional. 

Lema  1.2  Sean  A  y  B  numerables.  Los  siguientes  conjuntos  son  numerables: 

1.  AUB. 

2.  Ax  B. 

3.  Ak ,  donde  A1  =  A  y  Ak  =  A  x  Ak~r. 

4-  (J  At,  donde  todos  los  Ai  son  numerables. 

5.  A+  =  A1  U  A2  U  A3  U  ... 

Prueba:  Sean  a\,  02,-..  y  6i,  62,...  listados  que  mencionan  todos  los  elementos  de  A  y  B, 

respectivamente. 

1.  ai,  bi,  a2,  62,  •  •  •  lista  A  U  B  y  todo  elemento  aparece  en  la  lista  alguna  vez.  Si  A  n  B  ^  0 
esta  lista  puede  tener  repeticiones,  pero  eso  esta  permitido. 

2.  No  podemos  listar  (ai,6i),  (01,62),  (01,63),  ...  porque  por  ejemplo  nunca  llegariamos  a 
listar  (02,61).  Debemos  aplicar  un  recorrido  sobre  la  matriz  de  indices  de  modo  que  a  toda 
celda  (aj,6j)  le  llegue  su  turno.  Por  ejemplo,  por  diagonales  (i  +  j  creciente):  (01,61),  luego 
(02,61),  (01,  62),  luego  (03,  61),  (02,62),  (01, 63),  y  asf  sucesivamente. 

3.  Por  induction  sobre  k  y  usando  el  punto  2. 

4.  Sea  Oj(j')  el  j-esirno  elemento  de  la  lista  que  numera  At.  Nuevamente  se  trata  de  recorrer 
una  matriz  para  que  le  llegue  el  turno  a  todo  Oj(j'),  y  se  resuelve  como  el  punto  2. 

5.  Es  una  union  de  una  cantidad  numerable  de  conjuntos,  donde  cada  uno  de  ellos  es  numerable 
por  el  punto  3,  de  modo  que  se  puede  aplicar  el  punto  4.  Si  esto  parece  demasiado  esoterico, 
podemos  expresar  la  solution  concretamente:  listemos  el  elemento  1  de  A1;  luego  el  2  de  A1 
y  el  1  de  A2;  luego  el  3  de  A1,  el  2  de  A2  y  el  1  de  A3;  etc.  Esta  claro  que  a  cada  elemento 
de  cada  conjunto  le  llegara  su  turno. 


□ 

Observacion  1.4  El  ultimo  punto  del  Lema  1.2  se  refiere  al  conjunto  de  todas  las  secuencias 
finitas  donde  los  elementos  pertenecen  a  un  conjunto  numerable.  Si  esto  es  numerable, 
esta  claro  que  las  secuencias  finitas  de  elementos  de  un  conjunto  finito  tambien  lo  son. 
Curiosamente,  las  secuencias  infinitas  no  son  numerables,  ni  siquiera  sobre  conjuntos  finitos, 
como  se  vio  para  el  caso  de  bits  en  el  Teo.  1.2. 
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Notablemente,  aun  sin  haber  visto  casi  nada  de  computabilidad,  podemos  establecer  un 
resultado  que  nos  plantea  un  desafio  para  el  resto  del  curso: 

Teorema  1.3  Dado  cualquier  lenguaje  de  programacion,  existen  funciones  de  los  enteros 
que  no  se  pueden  calcular  con  ningun  programa  escrito  en  ese  lenguaje. 

Prueba:  Incluso  restringiendonos  a  las  funciones  que  dado  un  entero  deben  responder  “si”  o 

“no”  (por  ejemplo,  les  n  primo?),  hay  una  cantidad  no  numerable  de  funciones  /  :  N  — >  {0, 1}. 
Todos  los  programas  que  se  pueden  escribir  en  su  lenguaje  de  programacion  favorito,  en  carnbio,  son 
secuencias  finitas  de  simbolos  (ASCII,  por  ejemplo).  Por  lo  tanto  hay  solo  una  cantidad  numerable 
de  programas  posibles.  □ 

Mucho  mas  dificil  sera  exhibir  una  funcion  que  no  se  pueda  calcular,  pero  es  interesante 
que  la  inmensa  mayoria  efectivamente  no  se  puede  calcular.  En  realidad  esto  es  un  hecho  mas 
basico  aun,  por  ejemplo  la  inmensa  mayoria  de  los  numeros  reales  no  puede  escribirse  en  ningun  formalismo 
que  consista  de  secuencias  de  simbolos  sobre  un  alfabeto  numerable. 


1.4  Alfabetos,  Cadenas  y  Lenguajes 

En  esta  section  introducimos  notation  mas  espetifica  del  curso.  Comezaremos  por  definir  lo 
que  es  un  alfabeto. 

Definition  1.16  Llamaremos  alfabeto  a  cualquier  conjunto  finito  no  vacio.  Usualmente  lo 
denotaremos  como  E.  Los  elementos  de  E  se  llamaran  simbolos  o  caracteres. 

Si  bien  nornmlmente  usaremos  alfabetos  intuitivos  como  {0, 1},  {a,  b},  {a  . . .  z},  {0  . . .  9}, 
etc.,  algunas  veces  usaremos  conjuntos  mas  sofisticados  como  alfabetos. 

Definition  1.17  Llamaremos  cadena  a  una  secuencia  finita  de  simbolos  de  un  alfabeto  E, 
es  decir,  a  un  elemento  de 


E*  =  E°  U  E1  U  E2  U  ... 

donde  E1  =  E  y  Efc  =  E  x  Efe-1.  E*  denota,  entonces,  el  conjunto  de  todas  las  secuencias 
finitas  de  simbolos  de  E.  El  conjunto  E°  es  especial,  tiene  un  solo  elemento  llamado  e,  que 
corresponde  a  la  cadena  vacia.  Si  una  cadena  x  G  Efc  entonces  decimos  que  su  largo  es 
|x|  =  k  (por  ello  |e|  =  0).  Otro  conjunto  que  usaremos  es  E+  =  E*  —  {e}. 

Observation  1.5  Es  facil  confundir  entre  una  cadena  de  largo  1,  x  —  (a),  y  un  caracter  a. 
Normalmente  nos  permitiremos  identificar  ambas  cosas. 


1.5.  ESPECIFICACION  FINITA  DE  LENGUAJES 
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Definicion  1.18  Una  cadena  x  sobre  E  se  escribira  yuxtaponiendo  sus  caracteres  uno 
luego  del  otro,  es  decir  (ai,  a2, . . . ,  a\x\),  ai  G  E,  se  escribira  como  x  =  aia2...a\x\. 
La  concatenation  de  dos  cadenas  x  =  oq a2. .  .an  e  y  =  bib2 . . .  bm,  se  escribe 
xy  =  aia2  ■  ■  ■  anbib2  . .  .bm,  \xy\  =  |x|  +  \y\.  Finalmente  usaremos  xk  para  denotar  k 
concatenaciones  sucesivas  de  x,  es  decir  x°  =  £  y  xk  =  xxk~l . 

Definicion  1.19  Dadas  cadenas  x,  y,  z,  diremos  que  x  es  un  prefijo  de  xy,  un  sufijo  de  yx, 
y  una  subcadena  o  substring  de  yxz. 

Definicion  1.20  Un  lenguaje  sobre  un  alfabeto  E  es  cualquier  subconjunto  de  E*. 

Observation  1.6  El  conjunto  de  todas  las  cadenas  sobre  cualquier  alfabeto  es  numerable, 
|E*|  =  y  por  lo  tanto  todo  lenguaje  sobre  un  alfabeto  fmito  (e  incluso  numerable)  E 
es  numerable.  Sin  embargo,  la  cantidad  de  lenguajes  distintos  es  no  numerable,  pues  es 
|P(E*)|  >  No. 

Cualquier  operation  sobre  conjuntos  puede  realizarse  sobre  lenguajes  tambien.  Definamos 
ahora  algunas  operaciones  especificas  sobre  lenguajes. 

Definicion  1.21  Algunas  operaciones  aplicables  a  lenguajes  sobre  un  alfabeto  E  son: 

1.  Concatenation:  Li  o  L2  =  {xy,  x  G  Iq,  y  €  L2}. 

2.  Potential  L°  =  {e},  Lk  =  L  o  Lk~x. 

3.  Clausura  de  Kleene:  L*  =  (J k>0Lk. 

4.  Complemento:  Lc  —  E*  —  L. 

1.5  Especificacion  Finita  de  Lenguajes 

Si  un  lenguaje  L  es  finito,  se  puede  especificar  por  extension,  como  L 1  =  {aba,  bbbbb,  aa}. 
Si  es  infinito,  se  puede  especificar  mediante  predicados,  por  ejemplo  L2  =  {ap,  p  es  prirno}. 
Este  mecanismo  es  poderoso,  pero  no  permite  tener  una  idea  de  1a,  complejidad  del  lenguaje, 
en  cl  sentido  de  cuan  dificil  es  detcrminar  si  una  cadena  pertenece  o  no  a  L,  o  de  enumerar 
las  cadenas  de  L.  Con  L\  esto  es  trivial,  y  con  L2  perfectamente  factible.  Pero  ahora 
consideremos  L3  =  { an ,  n  >  0,  3x,y,z  G  N  —  {0},  xn  +  yn  =  zn}.  L3  esta  correctamente 
especificado,  pero  laaa  G  L{1  Recien  con  la  demostracion  del  ultimo  Teorema  de  Fermat 
en  1995  (luego  de  mas  de  3  siglos  de  esfuerzos),  se  puede  establecer  que  L3  =  {a,aa}. 
Similarmente,  se  puede  especificar  L4  =  {w,  w  es  un  teorema  de  1a,  teoria,  de  numeros},  y 
responder  si  w  G  L4  equivale  a  demostrar  un  teorema. 

El  terna  central  de  este  curso  se  puede  ver  como  1a,  busqueda  de  descripciones  finitas 
para  lenguajes  infinitos,  de  modo  que  sea  posible  determinar  mecanicamente  si  una  cadena 
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esta  en  cl  lenguaje.  ^Que  interes  tiene  esto?  No  es  dificil  identificar  lenguajes  con  problemas 
de  decision.  Por  ejemplo,  la  pregunta  ^el  grafo  G  es  bipartito?  se  puede  traducir  a  una 
pregunta  de  tipo  j  w  e  L?,  donde  L  es  el  conjunto  de  cadenas  que  representan  los  grafos 
bipartitos  (representados  como  una  secuencia  de  alguna  manera,  jfinalmente  todo  son  secuencias  de  bits 
en  el  computador !),  ywes  la  representation  de  G.  Determinar  que  ciertos  lenguajes  no  pueden 
decidirse  mecanicamente  equivale  a  determinar  que  ciertos  problemas  no  pueden  resolverse 
por  computador. 

El  siguiente  teorema,  nuevamente,  nos  dice  que  la  mayoria  de  los  lenguajes  no  puede 
decidirse,  en  cl  sentido  de  poder  decir  si  una  cadena  dada  lc  pertenece  o  no.  Nuevamente, 
es  un  desafio  encontrar  un  ejemplo. 

Teorema  1.4  Dado  cualquier  lenguaje  de  programacion,  existen  lenguajes  que  no  pueden 
decidirse  con  ningun  programa. 

Prueba:  Nuevamente,  la  cantidad  de  lenguajes  es  no  numerable  y  la  de  programas  que  se  pueden 
escribir  es  numerable.  □ 

En  cl  curso  veremos  mecanismos  progresivamente  mas  potentes  para  describir  lenguajes 
cada  vez  mas  sofisticados  y  encontraremos  los  limites  de  lo  que  puede  resolverse  por 
computador.  Varias  de  las  cosas  que  veremos  en  el  camino  tienen  ademas  muchas  aplicaciones 
practicas. 


Capitulo  2 

Lenguajes  Regulares 


[LP81,  sec  1.9  y  cap  2] 

En  este  capitulo  estudiaremos  una  forma  particularmente  popular  de  representation 
finita  de  lenguajes.  Los  lenguajes  regulares  son  interesantes  por  su  simplicidad,  la  qne 
pcrmite  manipularlos  facilmente,  y  a  la  vez  porqne  incluyen  muchos  lenguajes  relevantes  en 
la  practica.  Los  mecanismos  de  busqueda  provistos  por  varios  editores  de  texto  (vi,  emacs), 
asi  corno  por  cl  shell  de  Unix  y  todas  las  herramientas  asociadas  para  procesamiento  de  texto 
(sed,  awk,  perl),  se  basan  en  lenguajes  regulares.  Los  lenguajes  regulares  tambien  se  usan 
en  biologia  computational  para  busqueda  en  secuencias  de  ADN  o  proteinas  (por  ejemplo 
patrones  PROSITE). 

Los  lenguajes  regulares  se  pueden  describir  usando  tres  mecanismos  distintos:  expresiones 
regulares  (ERs),  automatas  finitos  detcrministicos  (AFDs)  y  no  detcrministicos  (AFNDs). 
Algunos  de  los  mecanismos  son  buenos  para  describir  lenguajes,  y  otros  para  implementar 
reconocedores  eficientes. 


2.1  Expresiones  Regulares  (ERs)  [lpsi,  sec  1.9] 

Definicion  2.1  Una  expresion  regular  (ER)  sobre  un  alfabeto  finito  E  se  define 
recur sivamente  como  sigue: 

1.  Para  todo  c  G  E,  c  es  una  ER. 

2.  $  es  una  ER. 

3.  Si  Ei  y  E2  son  ERs,  E\  \  E2  es  una  ER. 

4-  Si  Ei  y  E2  son  ERs,  Ei  ■  E2  es  una  ER. 

5.  Si  Ei  es  una  ER,  Ex  *  es  una  ER. 

6.  Si  Ei  es  una  ER,  ( Ei )  es  una  ER. 
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Cuando  se  lee  una  expresion  regular,  hay  que  saber  que  operador  debe  leerse  primero. 
Esto  se  llama  precedencia.  Por  ejemplo,  la  expresion  a  \  b  ■  c *,  /,debe  entenderse  como  (1) 
la  aplicada  al  resto?  (2)  ^la  “|”  aplicada  al  resto?  (3)  <da  aplicada  al  resto?  La 
respuesta  es  que,  primero  que  nada  se  aplican  los  “£’ ,  segundo  los  y  finalmente  los 
Esto  se  expresa  diciendo  que  cl  orden  de  precedencia  es  *,  •,  |.  Los  parentesis  sirven  para 
alterar  la  precedencia.  Por  ejemplo,  la  expresion  anterior,  dado  el  orden  de  precedencia  que 
establecimos,  es  equivalente  a  a  \  (b  ■  (c*)).  Se  puede  forzar  otro  orden  de  lectura  de  la  ER 
cambiando  los  parentesis,  por  ejemplo  (a  |  b)  ■  c*. 

Asimismo,  debe  aclararse  como  se  lee  algo  como  a\b\c,  es  decir  ^cual  de  los  dos  “|”  se 
lee  primero?  Convengamos  que  en  ambos  operadores  binarios  se  lee  primero  el  de  mas  a  la 
izquierda  (se  dice  que  el  operador  “asocia  a  la  izquierda”),  pero  realmente  no  es  importante, 
por  razones  que  veremos  enseguida. 

Observar  que  arm  no  hemos  dicho  que  signified  una  ER,  solo  hemos  dado  su  sintaxis  pero 
no  su  semantica.  De  esto  nos  encargamos  a  continuation. 

Definition  2.2  El  lenguaje  descrito  por  una  ER  E,  £(£),  se  define  recur sivamente  como 
sigue: 

1.  Si  C  G  E,  £(c )  =  {c}.  Esto  es  un  conjunto  de  una  sola  cadena  de  una  sola  letra. 

2.  £($)  =  0. 

3.  C(E1  |  E2)  =  C{E i)  U  £(£2). 

I  C{E1-E2)  =  C{Ef)  o  C(E2). 

5.  £(£i*)  =  £(£i)*. 

6.  £((£0)  =  C(Ei). 

Notar  que  C(a-b-c-d)  =  {abed},  por  lo  cual  es  comun  ignorar  el  simbolo  y  simplcmente 
yuxtaponer  los  shnbolos  uno  despues  del  otro.  Notar  tambien  que,  dado  que  “|”  y  se 
mapean  a  operadores  asociativos,  no  es  relevante  si  asocian  a  izquierda  o  a  derecha. 

Observation  2.1  Por  definicion  de  clausura  de  Kleene,  £($*)  =  {e}.  Por  ello,  a  pesar  de 
no  estar  formalmente  en  la  definicion,  permitiremos  escribir  e  como  una  expresion  regular. 

Definicion  2.3  Un  lenguaje  L  es  regular  si  existe  una  ER  E  tal  que  L  =  £(£). 

Ejemplo  2.1  ^Como  se  podrfa  escribir  una  ER  para  las  cadenas  de  a’s  y  b's  que  contuvieran  una 
cantidad  impar  de  6’s?  Una  solution  es  a*  ( ba-kba* )  *6a*,  donde  lo  mas  importante  es  la  clausura 
de  Kleene  mayor,  que  encierra  secuencias  donde  nos  aseguramos  que  las  b's  vienen  de  a  pares, 
separadas  por  cuantas  a’s  se  quieran.  La  primera  clausura  (a*)  permite  que  la  secuencia  empiece 
con  a’s  y  la  ultima  agrega  la  b  que  hace  que  el  total  sea  impar  y  ademas  permite  que  haya  a’s  al 
final.  Es  un  buen  ejercicio  jugar  con  otras  soluciones  y  comentarlas,  por  ejemplo  (a *  ba *  6a*)  *  6a*. 
Es  facil  ver  como  generalizar  este  ejemplo  para  que  la  cantidad  de  b's  modulo  k  sea  r. 
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Algo  importante  en  cl  Ej.  2.1  es  como  asegurarnos  de  que  la  ER  realmente  representa 
el  lenguaje  L  que  creemos.  La  tecnica  para  esto  tiene  dos  partes:  (i)  ver  que  toda  cadena 
generada  esta  en  L;  (ii)  ver  que  toda  cadena  de  L  se  puede  generar  con  la  ER.  En  el  Ej.  2.1  eso 
podria  hacerse  de  la  signiente  manera:  Para  (i)  basta  ver  que  la  clausura  de  Kleene  introduce 
las  6’s  de  a  dos,  de  modo  que  toda  cadena  generada  por  la  ER  tendra  una  cantidad  impar 
de  6’s.  Para  (ii),  se  debe  tomar  una  cadena  cualquiera  x  con  una  cantidad  impar  de  6’s  y 
ver  que  la  ER  puede  generarla.  Esto  no  es  dificil  si  consideramos  las  snbcadenas  de  x  que 
van  desde  una  b  impar  (lera,  3era,  ...)  hasta  la  siguiente,  y  mostramos  que  cada  una  de  esas 
snbcadenas  se  pueden  generar  con  ba  k  bark.  El  resto  es  sencillo.  Un  ejemplo  un  poco  mas 
complicado  es  el  signiente. 

Ejemplo  2.2  iComo  se  podria  escribir  una  ER  para  las  cadenas  de  o’ s  y  6’s  que  nunca  contuvieran 
tres  6’s  seguidas?  Una  solucion  parece  ser  (a  \  ba  \  bba)k ,  pero  ^esta  correcta?  Si  se  analiza 
rigurosamente,  se  notara  que  esta  ER  no  permite  que  las  cadenas  terminen  con  b,  por  lo  cual 
deberemos  corregirla  a  (a  \  ba  \  bba )  *  (s\b\bb). 

Ejemplo  2.3  /,Como  se  describiria  el  lenguaje  denotado  por  la  expresion  regular  (ab  \  aba)kl  Son 
las  cadenas  que  se  pueden  descomponer  en  secuencias  ab  o  aba.  Describir  con  palabras  el  lenguaje 
denotado  por  una  ER  es  un  arte.  En  el  Ej.  2.1,  que  empieza  con  una  bonita  descripcion  concisa, 
uno  podria  caer  en  una  descripcion  larga  y  mecanica  de  lo  que  significa  la  ER,  como  “primero 
viene  una  secuencia  de  a’s;  despues,  varias  veces,  viene  una  b  y  una  secuencia  de  a’s,  dos  veces; 
despues...”.  En  general  una  descripcion  mas  concisa  es  mejor. 

Ejemplo  2.4  ^Se  podria  escribir  una  ER  que  denotara.  los  mimeros  decimales  que  son  multiplos 
de  7?  (es  decir  7,  14,  21,  ...)  Si,  pero  intentarlo  directamente  es  una  empresa  temeraria.  Veremos 
mas  adelante  como  lograrlo. 

Observacion  2.2  Deberia  ser  evidente  que  no  todos  los  lenguajes  que  se  me  ocurran  pueden 
ser  descritos  con  ERs,  pues  la  cantidad  de  lenguajes  distintos  sobre  un  alfabeto  fmito  es  no 
numerable,  mientras  que  la  cantidad  de  ERs  es  numerable.  Otra  cosa  es  encontrar  lenguajes 
concretos  no  expresables  con  ERs  y  poder  demostrar  que  no  lo  son. 

Ejemplo  2.5  ^Se  podria  escribir  una  ER  que  denotara  las  cadenas  de  a’s  cuyo  largo  es  un  numero 
primo?  No,  no  se  puede.  Veremos  mas  adelante  como  demostrar  que  no  se  puede. 

Ejemplo  2.6  Algunas  aplicaciones  practicas  donde  se  usan  ERs  es  en  la  especificacion  de  fechas, 
direcciones  IP,  tags  XML,  nombres  de  variables  en  Java,  mimeros  en  notacion  flotante,  direcciones 
de  email,  etc.  Son  ejercicios  interesantes,  aunque  algunos  son  algo  tediosos. 


2.2  Automatas  Finitos  Determimsticos  (AFDs) 

[LP81,  sec  2.1] 

Lin  AFD  es  otro  mecanismo  para  describir  lenguajes.  En  vez  de  pensar  en  generar  las 
cadenas  (como  las  ERs),  un  AFD  describe  un  lenguaje  mediante  reconocer  las  cadenas  del 
lenguaje,  y  ninguna  otra.  El  siguiente  ejemplo  ilnstra  un  AFD. 
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Ejemplo  2.7  El  AFD  que  reconoce  el  mismo  lenguaje  del  Ej.  2.1  se  puede  graficar  de  la  siguiente 
forma. 


El  AFD  que  hemos  dibujado  se  interpreta  de  la  siguiente  manera.  Los  nodos  del  grafo  son 
estados.  El  apuntado  con  un  angulo  )  es  cl  estado  inicial,  en  el  que  empieza  la  computation. 
Estando  en  un  estado,  cl  AFD  lee  una  letra  de  la  entrada  y,  segun  indique  la  flecha  (llamada 
transition) ,  pasa  a  otro  estado  (sicmpre  debe  haber  exactamente  una  flecha  saliendo  de  cada 
estado  por  cada  letra).  Cuando  se  lee  toda  la  cadena,  cl  AFD  la  acepta  o  no  segun  cl  estado 
al  que  haya  llcgado  sea  final  o  no.  Los  estados  finales  se  dibujan  con  doblc  circulo. 

En  este  AFD  pasa  algo  que,  mas  o  menos  explicitamente,  siempre  ocurre.  Cada  estado 
se  puede  asociar  a  un  invariante,  es  decir,  una  afirmacion  sobre  la  cadena  leida  hasta  ese 
momento.  En  nuestro  caso  cl  estado  inicial  corresponde  al  invariante  “se  ha  visto  una 
cantidad  par  de  Es  hasta  ahora” ,  mientras  que  el  estado  final  corresponde  a  “se  ha  visto  una 
cantidad  impar  de  Es  hasta  ahora” . 

El  siguiente  ejemplo  muestra  la  utilidad  de  esta  vision.  La  correctitud  de  un  AFD  con 
respecto  a  un  cierto  lenguaje  L  que  se  pretende  representar  se  puede  demostrar  a  partir  de 
establecer  los  invariantes,  ver  que  los  estados  finales,  unidos  (pues  puede  haber  mas  de  uno), 
describen  L,  y  que  las  flechas  pasan  correctamente  de  un  invariante  a  otro. 

Ejemplo  2.8  El  AFD  que  reconoce  el  mismo  lenguaje  del  Ej.  2.2  se  puede  graficar  de  la  siguiente 
forma.  Es  un  buen  ejercicio  describir  el  invariante  que  le  corresponde  a  cada  estado.  Se  ve  adernas 
que  puede  haber  varios  estados  finales.  El  estado  3  se  llama  sumidero ,  porque  una  vez  caido  en  el, 
el  AFD  no  puede  salir  y  no  puede  aceptar  la  cadena. 


Es  hora  de  definir  formalmente  lo  que  es  un  AFD. 
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Definicion  2.4  Un  automata  finito  determimstico  (AFD)  es  una  tupla  M  =  (K,  E,  6,  s,  F), 
tal  que 

•  K  es  un  conjunto  finito  de  estados. 

•  E  es  un  alfabeto  finito. 

•  s  G  K  es  el  estado  initial. 

•  F  C  K  son  los  estados  finales. 

•  6  :  K  x  E  — »  K  es  la  funcion  de  transition. 

Ejemplo  2.9  El  AFD  del  Ej.  2.7  se  describe  formalmente  como  M  =  ( K,U,,5,s,F ),  donde  K  = 
{0, 1},  E  =  {a,  b},  s  =  0,  F  =  {1},  y  la  funcion  6  como  sigue: 


<5 

0 

1 

a 

0 

1 

b 

1 

0 

No  hemos  descrito  aun  formalmente  como  funciona  un  AFD.  Para  ello  necesitamos  la 
notion  de  configuracion,  que  contiene  la  information  necesaria  para  completar  el  computo 
de  un  AFD. 

Definicion  2.5  Una  configuration  de  un  AFD  M  =  ( K ,  E,  5,  s ,  F)  es  un  elemento  de  Cm  = 
K  x  E*. 

La  idea  es  que  la  configuracion  ( q ,  x)  indica  que  M  esta  en  el  estado  q  y  lc  falta  leer  la 
cadena  x  de  la  entrada.  Esta  es  information  suficiente  para  predecir  lo  qne  ocnrrira  en  cl 
futnro.  Lo  siguiente  es  describir  como  cl  AFD  nos  lleva  de  una  configuracion  a  la  siguiente. 

Definicion  2.6  La  relacion  lleva  en  un  paso,  \~mF  CmxCm  se  define  de  la  siguiente  manera: 
( q,ax )  h m  donde  a  G  E,  sii  S(q,a )  =  q' . 

Escribiremos  simplemente  h  en  vez  de  h m  cuando  quede  claro  de  qne  M  estamos 
hablando. 

Definicion  2.7  La  relacion  lleva  en  cero  o  mas  pasos  \~*M  es  la  clausura  refilexiva  y  transitiva 
de  Pm- 

Ya  estamos  en  condiciones  de  definir  cl  lcngnaje  aceptado  por  un  AFD.  La  idea  es  qne  si 
cl  AFD  es  llevado  del  estado  initial  a  uno  final  por  la  cadena  x ,  entonces  la  reconoce. 
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CAPITULO  2.  LENGUAJES  REGULARES 


Definicion  2.8  El  lenguaje  aceptado  por  un  AFD  M  =  (K,  E,  5,  s,  F )  se  define  como 


£(M)  =  {*eE*,  3 feF,  (s,x)  h*M  (/,£)}. 


Ejemplo  2.10  Tomemos  el  AFD  del  Ej.  2.8,  el  que  se  describe  formalmente  como  M  = 
(. K,Y],8,s,F ),  donde  K  =  {0,1,2, 3},  E  =  {a,  6},  s  =  0,  F  =  {0,1,2},  y  la  funcion  S  como 
sigue: 


5 

0 

1 

2 

3 

a 

0 

0 

0 

3 

b 

1 

2 

3 

3 

Ahora  consideremos  la  cadena  de  entrada  x  =  abbababb  y  escribamos  las  configuraciones  por 
las  que  pasa  M  al  recibir  x  como  entrada: 


(0,  abbababb)  b  (0 ,bbababb)  b  (1 ,bababb)  b  (2 ,ababb) 
b  (0,  babb)  b  (l,  abb)  b  (0 ,bb)  b  (1,6)  b  (2,e). 


Por  lo  tanto  (s,x)  b*  (2 ,  e),  y  como  2  €  F,  tenemos  que  x  €  C(M). 


Vamos  al  desaffo  del  Ej.  2.4,  cl  cual  resolveremos  con  un  AFD.  La  vision  de  invariantes 
es  especialmente  util  en  este  caso. 


Ejemplo  2.11  El  AFD  que  reconoce  el  mismo  lenguaje  del  Ej.  2.4  se  puede  graficar  de  la  siguiente 
forma.  Para  no  enredar  el  grafico  de  mas,  solo  se  incluyen  las  flechas  que  salen  de  los  estados  0,  1 
y  2. 


2.2.  AUTO  MATAS  FINITOS  DETERMINISTICOS  (AFDS) 
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El  razonamiento  es  el  siguiente.  Cada  estado  represents  el  resto  del  numero  leido  hasta  ahora, 
modulo  7.  El  estado  inicial  (y  final)  representa  el  cero.  Si  estoy  en  el  estado  2  y  viene  un  4, 
significa  que  el  numero  que  lei  hasta  ahora  era  n  =  2  (mod  7)  y  ahora  el  nuevo  numero  leido  es 
10-ra  +  4  =  10-2  +  4  =  24  =  3  (mod  7).  Por  ello  se  pasa  al  estado  3.  El  lector  puede  completar 
las  fiechas  que  faltan  en  el  diagrama. 

Hemos  resuelto  usando  AFDs  un  problema  que  es  bastante  mas  complicado  usando 
ERs.  El  siguiente  ejemplo  ilustra  el  caso  contrario:  cl  Ej.  2.3,  sumamente  facil  con  ERs, 
es  relativamente  complejo  con  AFDs,  y  de  hecho  no  es  facil  convencerse  de  su  correctitud. 
El  principal  problema  es,  cuando  se  ha  leido  ab,  determinar  si  una  a  que  sigue  inicia  una 
nueva  cadena  (pues  hemos  leido  la  cadena  ab)  o  es  el  ultimo  caracter  de  aba. 

Ejemplo  2.12  El  lenguaje  descrito  en  el  Ej.  2.3  se  puede  reconocer  con  el  siguiente  AFD. 
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CAPITULO  2.  LENGUAJES  REGULARES 


2.3  Automatas  Finitos  No  Determimsticos  (AFNDs) 

[LP81,  sec  2.2] 

Dado  el  estado  actual  y  cl  siguiente  caracter,  el  AFD  pasa  exactamente  a  un  siguiente 
estado.  Por  eso  se  lo  llama  determimstico.  Una  version  en  principio  mas  potente  es  un 
AFND,  donde  frente  a  un  estado  actual  y  un  siguiente  caracter,  es  posible  tener  cero,  uno  o 
mas  estados  siguientes. 

Hay  dos  formas  posibles  de  entender  como  funciona  un  AFND.  La  primera  es  pensar 
qne,  cnando  hay  varias  alternativas,  cl  AFND  elige  alguna  de  cllas.  Si  existe  una  forma  de 
clegir  cl  siguiente  estado  qne  me  lleve  finalmente  a  aceptar  la  cadena,  entonces  cl  AFND  la 
aceptara.  La  segnnda  forma  es  imaginarse  qne  el  AFND  esta  en  varios  estados  a  la  vez  (en 
todos  en  los  qne  “pnede  estar”  de  acnerdo  a  la  primera  vision).  Si  Inego  de  leer  la  cadena 
pnede  estar  en  un  estado  final,  acepta  la  cadena.  En  cualquier  caso,  es  bneno  por  un  rato 
no  pensar  en  como  implcmentar  un  AFND. 

Lina  libertad  adicional  qne  permitiremos  en  los  AFNDs  es  la  de  rotular  las  transiciones 
con  cadenas,  no  solo  con  caracteres.  Tal  transition  se  pnede  segnir  cnando  los  caracteres  de 
la  entrada  calzan  con  la  cadena  qne  rotula  la  transition,  consumicndo  los  caracteres  de  la 
entrada.  Lin  caso  particularmente  rclcvante  es  cl  de  las  llamadas  transiciones-e ,  rotnladas 
por  la  cadena  vacfa.  Lina  transitions  de  un  estado  p  a  uno  q  pcrmite  activar  q  sicmpre  qne 
se  active  p,  sin  necesidad  de  leer  ninghn  caracter  de  la  entrada. 

Ejemplo  2.13  Segrin  la  description,  es  muy  facil  definir  un  AFND  que  acepte  el  lenguaje  del 
Ej.  2.3.  Se  presentan  varias  alternativas,  donde  en  la  (2)  y  la  (3)  se  hace  uso  de  cadenas  rotulando 
transiciones. 


El  Ej.  2.13  ilustra  en  el  AFND  (3)  un  punto  interesante.  Este  AFND  tiene  solo  un  estado 
y  este  es  final.  ^Corno  pnede  no  aceptar  una  cadena?  Snpongamos  que  recibe  como  entrada 


2.3.  AUTO  MATAS  FINITOS  NO  DE  TERMINIS  TIC  OS  (AFNDS) 
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bb.  Parte  del  estado  initial  (y  final),  y  no  tiene  transiciones  para  moverse.  Queda,  pues, 
en  ese  estado.  ^Acepta  la  cadena?  No,  pues  no  ha  logrado  consumirla.  Un  AFND  acepta 
una  cadena  cuando  tiene  una  forma  de  consumirla  y  llegar  a  un  estado  final.  Es  hora  de 
formalizar. 

Definition  2.9  Un  automata  finito  no  determimstico  (AFND)  es  una  tupla  M  = 
(. K ,  E,  A,  s,  F ) ,  tal  que 

•  K  es  un  conjunto  finito  de  estados. 

•  E  es  un  alfabeto  finito. 

•  s  G  K  es  el  estado  initial. 

•  F  C  K  son  los  estados  finales. 

•  A  Cf  K  x  E*  x  K  es  la  relation  de  transition,  finita. 

Ejemplo  2.14  El  AFND  (2)  del  Ej.  2.13  se  describe  formalmente  como  M  =  (A,  E,  A,  s,  F), 
donde  K  =  {0,1,2},  E  =  {a,  6},  s  =  0,  F  =  {0},  y  la  relation  A  = 
{(0,o,l),  (1,6,2),  (2,o,0),  (2,  e,  0)}. 

Para  describir  la  semantica  de  un  AFND  reutilizaremos  la  notion  de  configuration 
(Def.  2.5).  Redefiniremos  la  relation  \~M  para  cl  caso  de  AFNDs. 

Definition  2.10  La  relacion  lleva  en  un  paso,  \~mQ  Cm  x  Cm,  donde  M  =  (A,  E,  A,  s,  F) 
es  un  AFND,  se  define  de  la  siguiente  manera:  (q,zx)  Pm  (q',x),  donde  z  G  E*,  sii 
(q,z,q')  G  A. 

Notese  que  ahora,  a  partir  de  una  cierta  configuration,  la  relacion  Pm  nos  puede  llevar 
a  varias  configuraciones  distintas,  o  incluso  a  ninguna.  La  clausura  reflexiva  y  transitiva 
de  Pm  se  llama,  nuevamente,  lleva  en  cero  o  mas  pasos,  \~*M.  Finalmente,  definimos  casi 
identicamente  al  caso  de  AFDs  el  lenguaje  aceptado  por  un  AFND. 

Definition  2.11  El  lenguaje  aceptado  por  un  AFND  M  =  (K,  E,  A,  s,  F)  se  define  como 

C{M)  =  {xgE*,  3/  G  F,  (s,x)  F*m  (fie)}. 


A  diferencia  del  caso  de  AFDs,  dada  una  cadena  x,  es  posible  llegar  a  varios  estados 
distintos  (o  a  ninguno)  luego  de  haberla  consumido.  La  cadena  se  declara  aceptada  si  alguno 
de  los  estados  a  los  que  se  llega  es  final. 
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CAPITULO  2.  LENGUAJES  REGULARES 


Ejemplo  2.15  Consideremos  la  cadena  de  entrada  x  =  ababaababa  y  escribamos  las 
configuraciones  por  las  que  pasa  el  AFND  (3)  del  Ej.  2.13  al  recibir  x  como  entrada.  En  un 
primer  intento: 


(0, ababaababa )  b  (0, abaababa )  b  (0, aababa) 

no  logramos  consumir  la  cadena  (por  haber  “tornado  las  transiciones  incorrectas” ) .  Pero  si  elegimos 
otras  transiciones: 


(0 ,  ababaababa)  b  (0, abaababa)  b  (0 ,ababa)  b  (0,6a)  b  (0, e). 

Por  lo  tanto  (s,x)  b*  (0,e),  y  como  0  €  F,  tenemos  que  x  €  C{M).  Esto  es  valido  a  pesar  de 
que  existe  otro  camino  por  el  que  (s,x)  b*  (0,  aababa),  de  donde  no  es  posible  seguir  avanzando. 

Terminaremos  con  una  nota  acerca  de  como  simular  un  AFND.  En  las  siguientes  secciones 
veremos  que  de  hecho  los  AFNDs  pueden  convertirse  a  AFDs,  donde  es  evidente  como 
simularlos  eficientemente. 

Observacion  2.3  Un  AFND  con  n  estados  y  m  transiciones  puede  simularse  en  un 
computador  en  tiempo  0(n  +  m)  por  cada  simbolo  de  la  cadena  de  entrada.  Es  un 
buen  ejercicio  pensar  como  (tiene  que  ver  con  recorrido  de  grafos,  especialmente  por  las 
transiciones-e). 

2.4  Conversion  de  ER  a  AFND  [lpsi,  sec  2.5] 


Como  adelantamos,  ERs,  AFDs  y  AFNDs  son  mecanismos  equivalentes  para  denotar  los 
lenguajes  regulares.  En  estas  tres  secciones  demostraremos  esto  mediante  convertir  ER  — y 
AFND  — »  AFD  — >  ER.  Las  dos  primeras  conversiones  son  muy  relevantes  en  la  practica, 
pues  permiten  construir  verificadores  o  buscadores  eficientes  a  partir  de  ERs. 

Hay  distintas  formas  de  convertir  una  ER  E  a  un  AFND  M,  de  modo  que  C(E)  =  £(M). 
Veremos  cl  metodo  de  Thompson,  que  es  de  los  mas  sencillos. 

Definicion  2.12  La  funcion  Th  convierte  ERs  en  AFNDs  segun  las  siguientes  reglas. 

1.  Para  c  G  £,  Th(c)  = 


2.  Th(<&)  = 


jSl,  el  grafo  puede  no  ser  conexo! 
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CAPITULO  2.  LENGUAJES  REGULARES 


Prueba:  Es  facil  verificarlo  por  inspection  y  aplicando  induction  estructural.  La  unica  parte  que 
puede  causar  problemas  es  la  clausura  de  Kleene,  donde  otros  esquemas  alternatives  que  podrlan 
sugerirse  (por  ejemplo  M  =  (Ai,E,Ai  U  {(/i,  e,  s±),  (si,  s,  fi)},  si,  {/i})  tienen  el  problema  de 
permitir  terminar  un  recorrido  de  Th(Ei)  antes  de  tiernpo.  Por  ejemplo  el  ejemplo  que  acabamos 
de  dar,  aplicado  sobre  E\  =  a  *  b,  reconoceri'a  la  cadena  x  =  aa.  □ 

Ejemplo  2.16  Si  aplicamos  el  metodo  de  Thompson  para  convertir  la  ER  del  Ej.  2.3  a  AFND, 
el  resultado  es  distinto  de  las  tres  variantes  dadas  en  el  Ej.  2.13. 


2.5  Conversion  de  AFND  a  AFD  [lpsi,  sec  2.3] 

Si  bien  los  AFNDs  tienen  en  principio  mas  flexibilidad  que  los  AFDs,  es  posiblc  construir 
siempre  un  AFD  equivalente  a  un  AFND  dado.  La  razon  fundamental,  y  la  idea  de  la 
conversion,  es  que  cl  conjunto  de  estados  del  AFND  que  pueden  estar  activos  despues  de 
haber  leido  una  cadena  x  es  una  funcion  unicamente  de  x.  Por  ello,  puede  disenarse  un  AFD 
basado  en  los  conjuntos  de  estados  del  AFND. 

Lo  primero  que  necesitamos  es  describir,  a  partir  de  un  estado  q  del  AFND,  a  que  estados 
q'  podemos  llegar  sin  consumir  caracteres  de  la  entrada. 

Definicion  2.13  Dado  un  AFND  M  =  (. K ,  E,  A,  s,  F),  la  clausura-e  de  un  estado  q  G  K  se 
define  como 

E(q)  =  {q'eK,(q,e)  \~*M  (q',e)}. 


Ya  estamos  en  condi ciones  de  definir  la  conversion  de  un  AFND  a  un  AFD.  Para  ello 
supondremos  que  las  transiciones  del  AFND  estan  rotuladas  o  bien  por  £  o  bien  por  una  sola 
letra.  Es  muy  facil  adaptar  cualquier  AFND  para  que  cumpla  esto. 

Definicion  2.14  Dado  un  AFND  M  =  (K,  E,  A,  s,  F)  que  cumple  (q,x,q')  G  A  =>■  |x|  <  l, 
se  define  un  AFD  det(M)  =  (. K ',  E,  5,  s',  F')  de  la  siguiente  manera: 


2.5.  CONVERSION  DE  AFND  A  AFD 
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1.  K'  —  p(K).  Es  decir  los  subconjuntos  de  K ,  o  conjuntos  de  estados  de  M. 

2.  s'  =  E(s).  Es  decir  la  clausura-e  del  estado  inicial  de  M. 

3.  F'  =  K'  —  p{K  —  F) .  Es  decir  todos  los  conjuntos  de  estados  de  M  que  contengan  algun  estado 
de  F. 

4-  Para  todo  Q  e  K'  (o  sea  QCK)ycEF, 

6(Q,c)  =  1J  £(<,'). 

<?eQ,(g,c,g')e  A 

Esta  ultima  ecuacion  es  la  que  preserva  la  semantica  que  buscamos  para  el  AFD. 

Ejemplo  2.17  Si  calculamos  det  sobre  el  AFND  del  Ej.  2.16  obtenemos  el  siguiente  resultado. 
Observar  que  se  trata  del  mismo  AFD  que  presentamos  en  el  Ej.  2.12.  Lo  que  era  un  desafio  hacer 
directamente,  ahora  lo  podemos  hacer  mecanicamente  mediante  convertir  ER  — >•  AFND  — >•  AFD. 


En  cl  Ej.  2.17  solo  hemos  graficado  algunos  de  los  estados  de  K',  mas  precisamente 
aquellos  alcanzables  desde  cl  estado  inicial.  Los  demas  son  irrelevantes.  La  forma  de 
determinizar  un  AFND  en  la  practica  es  calcular  s'  =  E(s),  luego  calcular  8(s',c )  para 
cada  c  G  E,  y  recursivamente  calcular  las  transiciones  que  salen  de  estos  nuevos  estados, 
hasta  que  todos  los  estados  nuevos  producidos  sean  ya  conocidos.  De  este  modo  se  calculan 
solamente  los  estados  necesarios  de  K'. 

Observacion  2.5  No  hay  garantia  de  que  el  metodo  visto  genere  el  menor  AFD  que  reconoce 
el  mismo  lenguaje  que  el  AFND.  Existen,  sin  embargo,  tecnicas  para  minimizar  AFDs,  que 
no  veremos  aqui. 

El  siguiente  teorema  establece  la  equivalencia  entre  un  AFND  y  cl  AFD  que  se  obtiene 
con  la  tecnica  expuesta. 
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CAPITULO  2.  LENGUAJES  REGULARES 


Teorema  2.2  Sea  M  un  AFND,  entonces  C(det(M ))  =  C(M). 

Prueba:  Demostraremos  que  toda  cadena  reconocida  por  el  AFD  M'  =  det(M)  tambien  es 

reconocida  por  el  AFND  M ,  y  viceversa.  En  cada  caso,  se  procede  por  induccion  sobre  la  longitud 
de  la  cadena.  Lo  que  se  demuestra  es  algo  un  poco  mas  fuerte,  para  que  la  induccion  funcione:  (i) 
si  x  lleva  de  s  a  q  en  el  AFND,  entonces  lleva  de  s'  =  E(s )  a  algrin  Q  tal  que  q  €  Q  en  el  AFD; 
(ii)  si  x  lleva  de  E(s)  a  Q  en  el  AFD,  entonces  lleva  de  s  a  cualquier  q  €  Q  en  el  AFND.  De  esto 
se  deduce  inmediatamente  que  x  €  C(M)  x  €  C(M'). 

Primero  demostremos  (i)  y  (ii)  para  el  caso  base  x  =  e.  Es  facil  ver  que  (e,  s)  \~*M  (e,  q )  sii 
q  €  E(s).  Por  otro  lado  (e,E(s))  \~*M,  (e,Q)  sii  Q  =  E(s)  pues  M’  es  determimstico.  Se  deducen 
(i)  y  (ii)  inmediatamente. 

Veamos  ahora  el  caso  inductivo  x  =  ya,  a  €  E,  para  (i).  Si  (s,  ya)  \~*M  (q,  e),  corno  M  consume 
las  letras  de  a  una,  existe  un  camino  de  la  forma  (s,ya)  \~*M  (q',a)  \~m  (q"i£)  \~*m  (<h£)- 

Notar  que  esto  implica  que  ( q',a,q ")  €  A  y  q  G  E(q").  Por  hipotesis  inductiva,  ademas,  tenemos 
(E(s),ya)  \~*M,  (Q',a)  para  algun  Q'  que  contiene  q' .  Ahora  bien,  (Q',a)  \~m '  (Q,£),  donde 
Q  =  S(Q',a)  incluye,  por  la  Def.  2.14,  a  E(q "),  pues  q'  €  Q'  y  (q',a,q")  €  A.  Finalmente,  como 
q  €  E(q"),  tenemos  q  G  Q  y  terminamos. 

Veamos  ahora  el  caso  inductivo  x  =  ya,  a  €  £,  para  (ii).  Si  (E(s),ya)  \~*M,  (Q,e) 

debemos  tener  un  camino  de  la  forma  (E(s),ya)  \~*M,  (Q',a)  \~m'  (Q,s),  donde  Q  =  S(Q',a). 
Por  hipotesis  inductiva,  esto  implica  (s,  ya)  \~*M  (q' ,  a)  para  todo  q'  €  Q' ■  Asimismo, 

(q',a)  \~m  (q",£)  \~*m  (<?,£),  para  todo  (q',a,q")  €  A,  y  q  G  E(q").  De  la  Def.  2.14  se  deduce 
que  cualquier  q  €  Q  pertenece  a  algun  E(q")  donde  (q1,  a,  q")  6  Ay  q'  £  Q' .  Hemos  visto  que  M' 
puede  llevar  a  cualquiera  de  esos  estados.  □ 

La  siguiente  observation  indica  como  buscar  las  ocurrencias  de  una  ER  en  un  texto. 

Observation  2.6  Supongamos  que  queremos  buscar  las  ocurrencias  en  un  texto  T  de  una 
ER  E.  Si  calculamos  det(Th(E-k  ■  E)),  obtenemos  un  AFD  que  reconoce  cadenas  terminadas 
en  E.  Si  alimentamos  este  AFD  con  el  texto  T,  Regard  al  estado  final  en  todas  las  posiciones 
de  T  que  terminan  una  ocurrencia  de  una  cadena  de  E.  El  algoritmo  resultante  es  muy 
eficiente  en  terminos  del  largo  de  T,  si  bien  la  conversion  de  AFND  a  AFD  puede  tomar 
tiem.po  exponencial  en  el  largo  de  E. 

2.6  Conversion  de  AFD  a  ER  [lpsi,  sec  2.5] 

Finalmente,  cerraremos  el  triangulo  mostrando  que  los  AFDs  se  pueden  convertir  a  ERs 
que  generen  el  mismo  lenguaje.  Esta  conversion  tiene  poco  interes  practico,  pero  es  esencial 
para  mostrar  que  los  tres  mecanismos  de  especificar  lenguajes  son  equivalentes. 

La  idea  es  numerar  los  estados  de  K  de  cero  en  adelante,  y  definir  ERs  de  la  forma 
R(i,  j,  k ),  que  denotaran  las  cadenas  que  llevan  al  AFD  del  estado  i  al  estado  j  utilizando  en  cl 
camino  solamente  estados  numerados  <  k.  Notar  que  los  caminos  pueden  ser  arbitrariamente 
largos,  pues  la  limitation  esta  dada  por  los  estados  intermedios  que  se  pueden  usar.  Asimismo 
la  limitation  no  vale  (obviamente)  para  los  extremos  i  y  j. 
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Definicion  2.15  Dado  un  AFD  M  =  (K,T,,S,s,F)  con  K  =  {0, 1, . . . ,  n  —  1}  definimos 
expresiones  regulares  R(i,j,k )  para  todo  0  <  i,j  <  n,  0  <  k  <  n,  inductivamente  sobre  k 
como  sigue. 


1.  R(i,j,  0) 


f  $  |  Ci  |  c2 
\  £  |  Ci  |  c2 


ci  si  {ci,  c2, . . . ,  ci}  =  {c  G  E,  5(i,  c)  =  j}  eifi-  j 
ci  si  {ci,  c2, . . . ,  ci}  =  {c  G  E,  S(i,  c)  =  j}  ei=  j 


2.  R(i,  j,  k  +  1)  =  R(i,  j,  k )  |  R(i ,  k,  k )  •  R(k,  k,k)  *  •  R(k,  j,  k ) . 


Notar  que  el  $  se  usa  para  el  caso  en  que  1  =  0. 


En  cl  siguiente  lema  establecemos  que  la  definicion  de  las  R  hace  lo  que  esperamos  de 

cllas. 


Lema  2.1  R(i,j ,  k )  es  el  conjunto  de  cadenas  que  reconoce  M  al  pasar  del  estado  i  al  estado 
j  usando  como  nodos  intermedios  solamente  nodos  numerados  <  k. 

Prueba:  Para  el  caso  base,  la  unica  forma  de  ir  de  i  a  j  es  mediante  transiciones  directas  entre 
los  nodos,  pues  no  esta  permitido  usar  ningun  nodo  intermedio.  Por  lo  tanto  solamente  podemos 
reconocer  cadenas  de  un  caracter.  Si  i  =  j  entonces  tambien  la  cadena  vacfa  nos  lleva  de  i  a  i.  Para 
el  caso  inductivo,  tenemos  que  ir  de  i  a  j  pasando  por  nodos  numerados  hasta  k.  Una  posibilidad 
es  solo  usar  nodos  <  k  en  el  camino,  y  las  cadenas  resultantes  son  R(i,j,k).  La  otra  es  usar  el 
nodo  k  una  6  mas  veces.  Entre  dos  pasadas  consecutivas  por  el  nodo  k,  no  se  pasa  por  el  nodo 
k.  De  rnodo  que  partimos  el  camino  entre:  lo  que  se  reconoce  antes  de  llegar  a  k  por  primera  vez 
(. R(i,k,k )),  lo  que  se  reconoce  al  ir  (dando  cero  6  mas  vueltas)  de  k  a  k  (R(k,k,k)*),  y  lo  que  se 
reconoce  al  partir  de  k  por  ultima  vez  y  llegar  a  j  ( R(k,j ,  k)).  □ 

Del  Lema  2.1  es  bastante  evidente  lo  apropiado  de  la  siguiente  definicion.  Indica  qne  cl 
lengnaje  reconocido  por  cl  AFD  es  la  union  de  las  R  desde  el  estado  initial  hasta  los  distintos 
estados  finales,  usando  cualquier  nodo  posiblc  en  el  camino  intermedio. 

Definicion  2.16  Sea  M  =  (K,  E,S,  s,F)  con  K  =  {0, 1, . . . ,  n  —  1}  un  AFD,  y  F  = 
{/i,  /2, . .  ■ ,  fm}-  Entonces  definimos  la  ER 

er(M)  =  R(s,fi,n )  |  R(s,f2,n )  |  ...  |  R(s,fm,n). 


De  lo  anterior  se  deduce  que  es  posible  generar  una  ER  para  cualquier  AFD,  manteniendo 
cl  mismo  lcnguaje. 

Teorema  2.3  Sea  M  un  AFD,  entonces  C{er{M))  =  C{M). 

Prueba:  Es  evidente  a  partir  del  Lema  2.1  y  del  hecho  de  que  las  cadenas  que  acepta  un  AFD 
son  aquellas  que  lo  llevan  del  estado  initial  a  algrin  estado  final,  pasando  por  cualquier  estado 
intermedio.  □ 
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Ejemplo  2.18  Consideremos  el  AFD  del  Ej.  2.7  y  generemos  er(M). 


er(M ) 

=  17(0,1,2) 

^(0, 1,2) 

=  17(0,1,1) 

1  R(o,  1,1) 

•17(1,1,1)*' 

•17(1,1,1) 

R(o,  1,1) 

=  R(o,i,o) 

1  17(0,0,0) 

•  17(0,0,0)  *• 

■17(0,1,0) 

R(  i,M) 

=  17(1,1,0) 

1  R(1,0,0) 

•  17(0,0,0)  *■ 

•17(0,1,0) 

R(  0,1,0) 

=  b 

17(0,0,0) 

=  a  \  e 

R(  1,1,0) 

=  a  \  e 

R(1,0,0) 

=  b 

17(1,1,1) 

=  a  \  e  \b ■ 

(a  |  e)  *  •  b 

=  a  e  ba-k  b 

R(  0,1,1) 

=  b  (a  e) 

■  (a  |  e)  k  -l 

5 

=  a-k  b 

17(0,1,2) 

=  a  *  6  |  a  ★  6  •  (a  |e 

ba  k  b)  k  ■  (a 

|  £  |  bak  b) 

er(M ) 

=  a-k  b  (a 

ba  k  b)k 

Notar  que  nos  hemos  permitido  algunas  simplificaciones  en  las  ERs  antes  de  utilizarlas  para 
R's  superiores.  El  resultado  no  es  el  misrno  que  el  que  obtuvimos  a  rnano  en  el  Ej.  2.1,  y  de  hecho 
toma  algo  de  tiernpo  convencerse  de  que  es  correcto. 

Como  puede  verse,  no  es  necesario  en  la  practica  calcnlar  todas  las  R(i,j,k),  sino  que 
basta  partir  de  las  que  solicita  er(M)  e  ir  produciendo  recursivamente  las  que  se  van 
necesitando. 

Por  ultimo,  habiendo  cerrado  cl  triangulo,  podemos  establecer  cl  siguiente  teorema 
fundamental  de  los  lenguajes  regulares. 

Teorema  2.4  Todo  lenguaje  regular  puede  ser  especificado  con  una  ER,  o  bien  con  un 
AFND,  o  bien  con  un  AFD. 

Prueba:  Inmediato  a  partir  de  los  Teos.  2.1,  2.2  y  2.3.  □ 

De  ahora  en  adelante,  cada  vez  que  se  liable  de  un  lenguaje  regular,  se  puede  suponer 
que  se  lo  tiene  descrito  con  una  ER,  AFND  o  AFD,  segun  resulte  mas  conveniente. 

Ejemplo  2.19  El  desaffo  del  Ej.  2.4  ahora  es  viable  en  forma  mecanica,  aplicando  er  al  AFD  del 
Ej.  2.11.  Toma  trabajo  pero  puede  hacerse  automaticamente. 


2.7  Propiedades  de  Clausura  [lpsi,  sec  2.4  y  2.6] 

Las  propiedades  de  clausura  se  refieren  a  que  operaciones  podemos  hacer  sobrc  lenguajes 
regulares  de  modo  que  el  resultado  siga  siendo  un  lenguaje  regular.  Primero  demostraremos 
algunas  propiedades  sencillas  de  clausura. 


2.8.  LEMA  DE  BOMBEO 


29 


Lema  2.2  La  union,  concatenacion  y  clausura  de  lenguajes  regulares  es  regular. 

Prueba:  Basta  considerar  ERs  E\  y  £2,  de  modo  que  los  lenguajes  L\  =  C(E\)  y  L2  =  £(£2)- 
Entonces  L\  U  £2  =  £(£i  \  E2),  L\  o  L2  =  C(E\  ■  £2)  y  LI*  =  £(£1*)  son  regulares.  □ 

Una  pregunta  un  poco  menos  evidente  se  refiere  a  la  complementation  e  intersection  de 
lengnajes  regulares. 

Lema  2.3  El  complemento  de  un  lenguaje  regular  es  regular  ,  y  la  interseccion  y  diferencia 
de  dos  lenguajes  regulares  es  regular. 

Prueba:  Para  el  complemento  basta  considerar  el  AFD  M  =  ( K ,  E,  5,  s ,  F)  que  reconoce  L ,  y  ver 
que  M'  =  (K,  S,  S,  s,  K  —  F)  reconoce  Lc  =  E*  —  L.  La  interseccion  es  inmediata  a  partir  de  la 
union  y  el  complemento,  L\  n  L2  =  {L\  U  L2)c.  La  diferencia  es  L\  —  £2  =  L\  n  L2.  □ 

Observacion  2.7  Es  posible  obtener  la  interseccion  en  forma  mas  directa,  considerando  un 
AFD  con  estados  K  =  Kx  x  K2.  Es  un  ejercicio  interesante  imaginar  como  opera  este  AFD 
y  definirlo  formalmente. 

Ejemplo  2.20  Es  un  desaflo  obtener  directamente  la  ER  de  la  diferencia  de  dos  ERs.  Ahora 
tenemos  que  esto  puede  hacerse  mecanicamente.  Es  un  ejercicio  interesante,  para  apreciar  la 
sofisticacion  obtenida,  indicar  paso  a  paso  como  se  harfa  para  obtener  la  ER  de  Li  —  L2  a  partir 
de  las  ERs  de  L 1  y  L2. 

Ejemplo  2.21  Las  operaciones  sobre  lenguajes  regulares  permiten  demostrar  que  ciertos 
lenguajes  son  regulares  con  mas  herramientas  que  las  provistas  por  ERs  o  automatas.  Por  ejemplo, 
se  puede  demostrar  que  los  numeros  decimales  correctamente  escritos  (sin  ceros  delante)  que  son 
multiples  de  7  pero  no  multiplos  de  11,  y  que  ademas  tienen  una  cantidad  impar  de  digitos  ‘4’, 
forrnan  un  lenguaje  regular.  Llamando  D  =  0  |  1  |  ...  |  9,  Mj  al  AFD  del  Ej.  2.11,  M\\  a  uno 
similar  para  los  multiplos  de  11,  y  L4  a  una  ER  similar  a  la  del  Ej.  2.1  pero  que  cuenta  4’s,  el 
lenguaje  que  queremos  es  —  £(Mn))  n  £(£4))  —  C( 0  •  DE).  ^Se  atreve  a  dar  una  ER  o 

AFND  para  el  resultado?  (no  es  en  serio,  puede  llevarle  rnucho  tiernpo). 


2.8  Lema  de  Bombeo 


[LP81,  sec  2.6] 


Hasta  ahora  hemos  visto  cliversas  formas  de  mostrar  que  un  lenguaje  es  regular,  pero 
ninguna  (aparte  de  que  no  nos  funcione  nada  de  lo  qne  sabemos  hacer)  para  mostrar  qne  no 
lo  es.  Veremos  ahora  una  herramienta  para  demostrar  qne  un  cierto  L  no  es  regular. 

Observacion  2.8  Pregunta  capciosa:  Esta  herramienta  que  veremos,  ifunciona  para 
todos  los  lenguajes  no  regulares?  jlmposible,  pues  hay  mas  lenguajes  no  regulares  que 
demostraciones! 
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La  idea  esencial  es  que  un  lenguaje  regular  debe  tener  cierta  repetitividad,  producto  de 
la  capacidad  limitada  del  AFD  que  lo  reconoce.  Mas  precisamente,  todo  lo  que  cl  AFD 
recuerda  sobre  la  cadena  ya  lcfda  se  condensa  en  su  estado  actual,  para  cl  cual  hay  solo  una 
cantidad  finita  de  posibilidades.  El  siguiente  teorema  (que  por  alguna  razon  se  llama  Lerna 
de  Bombeo)  explota  precisamente  este  hecho,  aunque  a  primera  vista  no  se  note,  ni  tampoco 
se  vea  como  usarlo  para  probar  que  un  lenguaje  no  es  regular. 

Teorema  2.5  (Lema  de  Bombeo) 

Sea  L  un  lenguaje  regular.  Entonces  existe  un  numero  N  >  0  tal  que  toda  cadena  w  E  L 
de  largo  |w|  >  N  se  puede  escribir  como  w  =  xyz  de  modo  que  y  ^  e,  \xy\  <  N ,  y 
Vn  >  0,  xynz  E  L. 

Prueba:  Sea  M  =  (A,  £,  5,  s,  F)  un  AFD  que  reconoce  L.  Definiremos  N  =  \K\.  A1  leer  w, 
M  pasa  por  distintas  configuraciones  hasta  llegar  a  un  estado  final.  Consideremos  los  primeros  N 
caracteres  de  w  en  este  camino,  llamandole  ft  al  estado  al  que  se  llega  luego  de  consumir  w\w2  . .  .rep 

(go>  ^1^2  •  •  •)  F  (qi,w2...)  F...F  (ft,  Wi+i  ■  ■  •  )  F...L  (ft,' wj+1...)  F...F  (qN,wN+i . . .)  F... 

Los  estados  qo,  qi,  ■  ■  ■ ,  qN  no  pueden  ser  todos  distintos,  pues  M  tiene  solo  N  estados.  De  modo 
que  en  algun  punto  del  camino  se  repite  algun  estado.  Digamos  ft  =  ft,  i  <  j-  Eso  significa  que,  si 
eliminamos  y  =  rft-t-i  uy+2  . .  .Wj  de  w,  M  llegara  exactamente  al  mismo  estado  final  al  que  llegaba 
antes: 

(q0,w  iw2...)  F  (qi,w2...)  F...F  (ft-i,^...)  F  (ft  =  ft,  wj+1 . . .)  F...F  (qN,  wN+1  . . .)  F... 

y,  similarmente,  podemos  duplicar  y  en  w  tantas  veces  como  queramos  y  el  result.ado  sera  el  mismo. 
Llamando  x  =  w\ . . .  Wi,  y  =  Wi+ \ . . .  Wj,  y  z  =  ift+i  • . .  w\w\,  tenemos  entonces  el  teorema.  Es  facil 
verificar  que  todas  las  condiciones  valen.  □ 

^Como  utilizar  cl  Lema  de  Bombeo  para  demostrar  que  un  lenguaje  no  es  regular?  La 
idea  es  negar  las  condiciones  del  Teo.  2.5. 

1.  Para  cualquier  longitud  N, 

2.  debemos  ser  capaces  de  elegir  alguna  w  E  L,  |w|  >  N, 

3.  de  modo  que  para  cualquier  forma  de  partir  w  =  xyz,  y  ^  £,  \xy\  <  N, 

4.  podamos  encontrar  alguna  n  >  0  tal  que  xynz  jL  L. 

Lina  buena  forma  de  pensar  en  este  proceso  es  en  que  se  juega  contra  un  adversario.  El 
clige  N,  nosotros  w,  el  la  particiona  en  xyz,  nosotros  elegimos  n.  Si  somos  capaces  de  ganarle 
haga  lo  que  haga,  hemos  demostrado  que  L  no  es  regular. 

Ejemplo  2.22  Demostremos  que  L  =  {anbn,  n  >  0}  no  es  regular.  Dado  N ,  elegimos  w  =  aNbN . 
Ahora,  se  elija  como  se  elija  y  dentro  de  w,  esta  constara  de  puras  a’s,  es  decir,  x  =  ar ,  y  =  as, 
z  =  aN~r~sbN ,  r+s  <  N,  s  >  0.  Ahora  basta  mostrar  que  xy°z  =  xz  =  araN~r~sbN  =  aN~sbN  0  L 
pues  s  >  0. 
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Un  ejemplo  que  requiere  algo  mas  de  inspiration  es  cl  siguiente. 

Ejemplo  2.23  Demostremos  que  L  =  {ap,  p  es  primo}  no  es  regular.  Dado  N,  elegimos  un 
primo  p  >  N  +  1,  w  =  ap.  Ahora,  para  toda  election  x  =  ar,  y  =  as,  z  =  a*,  r  +  s  + 1  =  p,  debemos 
encontrar  algun  n  >  0  tal  que  ar+ns+t  0  L,  es  decir,  r  +  ns  + 1  no  es  primo.  Pero  esto  siempre  es 
posible,  basta  con  elegir  n  =  r  +  t  para  tener  r  +  ns  +  t  =  (r  + 1)  (s  +  1)  compuesto.  Ambos  factores 
son  mayores  que  1  porque  s>0yr  +  t  =  p—  s  >  ( N  +  1)  —  N. 


2.9  Propiedades  Algoritmicas  de  Lenguajes  Regulares 

[LP81,  sec  2-4] 

Antes  de  terminar  con  lenguajes  regulares,  examinemos  algunas  propiedades  llamadas 
“algoritmicas”,  que  tienen  relation  con  que  tipo  de  preguntas  pueden  hacerse  sobre  lenguajes 
regulares  y  responderse  en  forma  mecanica.  Si  bien  a  esta  altura  pueden  parecer  algo 
esotericas,  estas  preguntas  adquieren  sentido  mas  adelante. 


Lema  2.4  Dados  lenguajes  regulares  L,  L\,  L-2  (descritos  mediante  ERs  o  automatas),  las 
siguientes  preguntas  tienen  respuesta  algoritmica: 


1. 

2. 

3. 

I 

5. 


Dada  u 

>  e  £*, 

&Es 

L  = 

=  0? 

&Es 

L  = 

=  £*? 

&Es 

Lx 

c  l2? 

&Es 

Lx 

=  l2? 

Prueba:  Para  (1)  tomamos  el  AFD  que  reconoce  L  y  lo  alimentamos  con  w,  viendo  si  llega  a 
un  estado  final  o  no.  jPara  eso  son  los  AFDs!.  Para  (2),  vemos  si  en  el  AFD  existe  un  carnino 
del  estado  initial  a  un  estado  final.  Esto  se  resuelve  fdcilmente  con  algoritmos  de  grafos.  Para  (3), 
complementamos  el  AFD  de  L  y  reducimos  la  pregunta  a  (2).  Para  (4),  calculamos  L  =  L\  —  L2 
y  reducimos  la  pregunta  a  (2)  con  respecto  a  L.  Para  (5),  reducimos  la  pregunta  a  (4),  L\  C  L2  y 
L2  C  L1.  □ 


Observation  2.9  En  estas  demostraciones  hemos  utilizado  por  primera  vez  el  concepto  de 
reduction  de  problemas:  se  reduce  un  problema  que  no  se  sabe  resolver  a  uno  que  si  se  sabe. 
Mas  adelante  usaremos  esta  idea  al  reves:  reduciremos  un  problema  que  sabemos  que  no  se 
puede  resolver  a  uno  que  queremos  demostrar  que  no  se  puede  resolver. 
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2.10  Ejercicios 

Expresiones  Regulares 

1.  /,Que  lenguaje  representa  la  expresion  ((a*  a)  b)  \  b  ? 

2.  Reescriba  las  siguientes  expresiones  regulares  de  una  forma  mas  simple 

(a)  <£>*  |  a*  |  b-k  |  (a  |  b)  k 

(b)  ((a*  &*)*  (6*  a*)*)* 

(c)  ( a-k  b )  *  |  (b-k  a )* 

(d)  (a  |  b)  -k  a  (a  |  6)  * 

3.  Sea  E  =  {a,  b}.  Escriba  expresiones  regulares  para  los  siguientes  conjuntos 

(a)  Las  cadenas  en  E*  con  no  mas  de  3  a’s. 

(b)  Las  cadenas  en  E*  con  una  cantidad  de  a’s  divisible  por  3. 

(c)  Las  cadenas  en  E*  con  exactamente  una  ocurrencia  de  la  subcadena  aaa. 

4.  Pruebe  que  si  L  es  regular,  tambien  lo  es  L'  =  {mu,  u  G  E*,  w  G  L},  mediante  hallar 
una  expresion  regular  para  L' . 

5.  ^Cuales  de  las  siguientes  afirmaciones  son  verdaderas?  Explique.  (Abusaremos  de  la 
notation  escribiendo  c*  para  {c}*). 

(a)  baa  G  a*b*a*b* 

(b)  b*a*  n  a*b*  =  a*  U  b* 

(c)  a*b*  n  c*d*  =  0 

(d)  abed  G  ( a(cd)*b )* 

AFDs,  AFNDs  y  Conversiones 

1.  Dibuje  los  siguientes  AFDs  y  describa  informalmente  el  lenguaje  que  aceptan.  Hemos 
escrito  la  funcion  <5  como  un  conjunto. 

(a)  K  =  {g0,  gi,  g2,  gs},  E  =  {a,  b},  s  =  q0  ,F  =  {gi}, 

<5  =  {(g0,  a,  gi),  (g0,  b,  g2),  (gi,  a,  g3),  (gi,  b,  go),  (g2,  a,  g2),  (g2,  b,  g2),  (g3,  a,  g2),  (g3,  b,  g2)}. 

(b)  K  =  {g0,  gi,  g2,  g3,  g4},  S  =  {a,  b},  s  =  q0  ,F  =  {g2,  g3}, 

5  =  {(g0,  a,  gi),  (go,  b,  g3),  (g4,  a,  g4),  (gi,  b,  g2),  (g2,  a,  g4),  (g2,  b,  g4),  (g3,  a,  g4),  (g3, 6,  g4), 

(g4,a,g4),  (g4,6,g4)}. 
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(c)  K  =  {g0,  9i,  92,  <?s},  S  =  {a,  6},  s  =  g0  ,  F  =  {g0}, 

5  =  {(g0,a,gi),  (q0,b,q3),  (q1,a,q2),  (gi,Mo),  (q2,a,q3),  (q2,b,q1),  (q3,a,q3),  (q3,b,q3)}. 

(d)  Idem  al  anterior  pero  s  =  gi,  F  =  {gi}. 

2.  Construya  AFDs  que  acepten  cada  uno  de  los  siguientes  lenguajes.  Escribalos 
formalmente  y  dibujelos. 

(a)  {w  G  {a,  b}*,  cada  a  en  w  esta  precedido  y  seguido  por  una  b} 

(b)  (tc  G  {a,  b}*,  w  tiene  abab  como  subcadena} 

(c)  {w  G  {a,  b}*,  w  no  tiene  aa  ni  bb  como  subcadena} 

(d)  {w  G  {a,  b}*,  w  tiene  una  cantidad  impar  de  a’s  y  una  cantidad  par  de  6’s}. 

(e)  {w  G  {a,  b}*,  w  tiene  ab  y  ba  como  subcadenas}. 

3.  ^Cuales  de  las  siguientes  cadenas  son  aceptadas  por  los  siguientes  automatas? 


(a)  aa,  aba,  abb,  ab,  abab. 


£ 

4.  Dibuje  AFNDs  que  acepten  los  siguientes  lenguajes.  Luego  conviertalos  a  AFDs. 

(a)  (, ab)*(ba )*  U  aa* 

(b)  ((ab  U  aab)*a*)* 

(c)  ((a*b*a*)*b)* 

(d)  (ba  U  by  U  (bb  U  a)* 


5.  Escriba  expresiones  regulares  para  los  lenguajes  aceptados  por  los  siguientes  AFNDs. 
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(a)  K  =  {g0,  qi},  S  =  {a,  6},  s  =  q0  ,  F  =  {g0}, 

A  =  {(g0,  ab,  g0),  (g0,  a,  gi),  (gi,  bb,  g4)} 

(b)  K  =  {g0,  gi,  g2,  g3},  S  =  {a,  6},  s  =  g0  ,  A  =  {g0,  g2}, 

A  =  {(g0,  a,  gi),  (gi,  b,  g2),  (g2,  a,  gi),  (gi,  6,  g3),  (g3,  a,  g2)} 

(c)  A'  =  {g0,  gi,  g2,  g3,  g4,  g5},  S  =  {a,  6},  s  =  q0  ,F  =  {g4,  g5}, 

A  =  {(g0,  e,  gi),  (go,  a,  g4),  (gi,  a,  g2),  (g2,  a,  g3),  (g3,  a,  g4),  (g4,  a,  g5),  (g5,  a,  g4)} 

6.  (a)  Encuentre  un  AFND  simple  para  (aa  |  aab  \  aba)*. 

(b)  Conviertalo  en  un  automata  determim'stico  usando  el  algoritmo  visto. 

(c)  Trate  de  entender  el  funcionamiento  del  automata.  ^Puede  hallar  uno  con  menos 
estados  que  reconozca  el  mismo  lenguaje? 

(d)  Repita  los  mismos  pasos  para  (a  |  b)  *  aabab. 

Propiedades  de  Clausura  y  Algoritmicas 

1.  Pruebe  que  si  L  es  regular,  entonces  los  siguientes  conjuntos  tambien  lo  son 

(a)  Pref(L)  =  {x,  By,  xy  e  L} 

(b)  Suf(L)  =  {y,  Bx,  xy  G  L} 

(c)  Subs(L)  =  {y,  B x,z,  xyz  G  L} 

(d)  Max(L)  =  {w  <E  L,  x  e  =>■  wx  L} 

(e)  LR  =  {wR,  w  G  L}  (■ wR  es  w  leido  al  reves). 

2.  Muestre  que  hay  algoritmos  para  responder  las  siguientes  preguntas,  donde  L4  y  A2 
son  lenguajes  regulares 

(a)  No  hay  una  sola  cadena  w  en  comun  entre  A4  y  L2. 

(b)  L i  y  L2  son  uno  el  complemento  del  otro 

(c)  L\  =  L2 

(d)  Lx  =  Pref  (L2) 

Lenguajes  Regulares  y  No  Regulares 

1.  Demuestre  que  cada  uno  de  los  siguientes  conjuntos  es  o  no  es  regular. 

(a)  {a10",  n  >  0} 

(b)  {w  G  {0..9}*,  w  representa  10"  para  algun  n  >  0} 
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(c)  {w  G  {0..9}*,  w  es  una  secuencia  de  di'gitos  que  aparece  en  la  expansion  decimal 
de  1/7  =  0.142857  142857  142857...} 

2.  Demuestre  qne  el  conjunto  {anbamban+m,  n,  rn  >  0}  no  es  regular.  Visto 

operacionalmente,  esto  implica  que  los  automatas  finitos  no  saben  “sumar” . 

3.  Pruebe  que  los  siguientes  conjuntos  no  son  regulares. 

(a)  {wwR,  w  G  {a,  b}*} 

(b)  {ww,  w  G  (a,  b}*} 

(c)  {ww,  w  G  (a,  5}*}.  w  es  w  donde  cada  a  se  cambia  por  una  b  y  viceversa. 

4.  ^Cierto  o  falso?  Demuestre  o  de  contraejemplos. 

(a)  Todo  subconjunto  de  un  lenguaje  regular  es  regular 

(b)  Todo  lenguaje  regular  tiene  un  subconjunto  propio  regular 

(c)  Si  L  es  regular  tambien  lo  es  {xy,  iGl,  y  L} 

(d)  Si  L  es  regular,  tambien  lo  es  (w  G  L,  ningun  prefijo  propio  de  w  pertenece  a 
L}. 

(e)  (w,  w  =  wR}  es  regular 

(f)  Si  L  es  regular,  tambien  lo  es  (w,  w  G  L,  wR  G  L } 

(g)  Si  {Li,L2,  ...}  es  un  conjunto  infinito  de  lcnguajes  regulares,  tambien  lo  es  |J  Li, 
o  sea  la  union  de  todos  ellos.  iY  si  cl  conjunto  es  finito? 

(h)  {xyxR,  x,y  G  E*}  es  regular. 


2.11  Preguntas  de  Cont roles 

A  continuation  se  muestran  algunos  ejercicios  de  controles  de  anos  pasados,  para  dar  una 
idea  de  lo  que  se  puede  esperar  en  los  proximos.  Hemos  omitido  (i)  (casi)  repeticiones,  ( ii ) 
cosas  que  ahora  no  se  ven,  (in)  cosas  que  ahora  se  dan  como  parte  de  la  materia  y/o  estan 
en  los  ejercicios  anteriores.  Por  lo  mismo  a  veces  los  ejercicios  se  han  alterado  un  poco  o  se 
presenta  solo  parte  de  ellos,  o  se  mezclan  versiones  de  ejercicios  de  distintos  anos  para  que 
no  sea  repet  it  ivo. 

Cl  1996,  1997  Responda  verdadero  o  falso  yjustifique  brevemente  (maximo  5  lineas) .  Una 
respuesta  sin  jusitificacion  no  vale  nada  aunque  este  correcta,  una  respuesta  incorrecta 
puede  tener  algun  valor  por  la  justification. 

a)  Si  un  automata  “finito”  pudiera  tener  infinitos  estados,  podria  reconocer  cualquier 
lenguaje. 
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b )  No  hay  algoritmo  para  saber  si  un  automata  finito  reconoce  un  lenguaje  finito  o 
infinito. 

c)  La  union  o  intersection  de  dos  lcnguajes  no  regulares  no  pnede  ser  regular. 

d)  Si  la  aplicacion  del  Lerna  del  Bombeo  para  lcnguajes  regulares  falla,  entonces  el 
lenguaje  es  regular. 

e)  Dados  dos  lcnguajes  regulares  L i  y  L2,  existe  algoritmo  para  determinar  si  el 
conjunto  de  prefijos  de  L\  es  igual  al  conjunto  de  sufijos  de  L2. 

Hemos  unido  ejercicios  similares  de  esos  anos. 

Cl  1996  Suponga  que  tiene  que  buscar  un  patron  p  en  un  texto,  ejemplo  "lolo".  Queremos 
construir  un  automata  finito  que  acepte  un  texto  si  y  solo  si  este  contiene  el  patron  p. 

a)  Escriba  la  expresion  regular  que  corresponde  a  los  textos  que  desea  aceptar. 

b)  Dibuje  un  automata  finito  equivalente  a  la  expresion  regular. 

c)  Para  cl  ejemplo  de  p  ="lolo",  convierta  cl  automata  a  deterministico.  Observe 
que  no  vale  la  pena  generar  mas  de  un  estado  final,  son  todos  equivalentes. 

ER  1996  Lin  automata  de  multiple  entrada  es  igual  a  los  normales,  excepto  porque  puede 
tener  varios  estados  iniciales.  El  automata  acepta  x  si  comenzando  de  algun  estado 
initial  se  acepta  x. 

a)  Use  un  automata  de  dos  entradas  para  reconocer  el  lenguaje  de  todas  las  cadenas 

de  ceros  y  unos  sin  dos  snnbolos  iguales  consecutivos. 

b)  Describa  formalmente  un  automata  de  multiple  entrada,  en  su  version 

deterministica  y  no  determimstica.  Describa  formalmente  cl  conjunto  de  cadenas 
aceptadas  por  tales  automatas. 

c)  ^Los  automatas  de  multiple  entrada  son  mas  potentes  que  los  normales  o  no? 

Demuestrelo. 

Cl  1997  Dado  cl  lenguaje  de  las  cadenas  binarias  donde  nunca  aparece  un  cero  aislado: 

•  De  una  expresion  regular  que  lo  genere. 

•  Conviertala  a  un  automata  no  deterministico  con  el  metodo  visto.  Simplifique  cl 
automata. 

•  Convierta  este  automata  simplificado  a  deterministico  con  el  metodo  visto. 
Simplifique  cl  automata  obtenido. 

Cl  1998,  1999 
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a)  Utilice  los  metodos  vistos  para  determinar  si  los  siguientes  automatas  son  o  no 
equivalentes. 

b)  Exprese  cl  lenguaje  aceptado  por  el  automata  dc  la  izquierda  como  una  expresion 
regular. 

c)  Convierta  el  automata  de  la  derecha  en  un  automata  finito  deterministico. 


Se  unieron  distintas  preguntas  sobre  los  mismos  automatas  en  esos  anos. 

Cl  1998  Dada  la  expresion  regular  a(a  \  bci)*  b*\ 

a)  Indique  todas  las  palabras  de  largo  4  que  pertenecen  al  lenguaje  representado  por 
esta  expresion  regular. 

b)  Construya  un  automata  finito  no  deterministico  que  reconozca  este  lenguaje. 

Cl  1998  Es  facil  determinar  si  una  palabra  pertenece  o  no  a  un  lenguaje  usando  un 
automata  finito  deterministico.  Sin  embargo,  al  pasar  de  un  AFND  a  un  AFD  cl 
numero  de  estados  puede  aumentar  exponencialmente,  lo  que  aumenta  el  espacio 
necesario.  Una  solution  alternativa  es  simular  un  automata  finito  no  deterministico. 

Escriba  en  pseudo-lenguaje  una  funcion  Acepta(M,  w)  que  dado  un  AFND  M  = 
(K,  E,  A,  s ,  F )  y  una  palabra  w,  retorne  V  o  F,  si  pertenece  o  no  al  lenguaje  que 
acepta  M.  Puede  usar  la  notation  M.K,  M.s,  etc.,  para  obtener  cada  elemento  del 
automata  y  suponer  que  todas  las  operaciones  basicas  que  necesite  ya  existen  (por 
ejemplo,  operaciones  de  conjuntos). 

Ex  1999,  Cl  2002  Demuestre  que  los  siguientes  lenguajes  no  son  regulares. 

a)  {anbm,  n  >  m}. 

b)  {anbmar,  r  >  n}. 

Cl  2000  Un  transductor  e s  una  tupla  M  =  (K,T,,S,s),  donde  K  es  un  conjunto  finito  de 
estados,  E  es  un  alfabeto  finito,  .s  G  K  es  cl  estado  initial  y 

5  :  K  x  E  — >  K  x  E* 

La  idea  es  que  un  transductor  lee  una  cadena  de  entrada  y  produce  una  cadena  de 
salida.  Si  estamos  en  el  estado  q  y  leemos  el  caracter  a,  y  d(q,a)  =  ( q',x )  entonces  cl 


38 


CAPITULO  2.  LENGUAJES  REGULARES 


transductor  pasa  al  estado  q'  y  produce  la  cadena  x.  En  la  representation  grafica  se 
pone  a/x  sobre  la  flecha  que  va  de  q  a  q' . 


Por  ejemplo,  cl  transductor  izquierdo  de  la  figura  elimina  todos  los  ceros  de  la  entrada 
y  a  los  unos  restantes  los  convierte  en  ceros.  El  de  la  derecha  considera  las  secnencias 
segnidas  de  ceros  o  unos  y  las  trunca  para  que  sus  longitudes  sean  multiplos  de  3  (ej. 
0000111000001111  000111000111). 


(a)  Dibuje  un  transductor  que  tome  las  secuencias  seguidas  de  ceros  o  unos 
de  la  entrada  y  solo  deje  un  representante  de  cada  secuencia,  por  ejemplo 
001110011001000111  ->■  01010101. 

( b )  Defina  formalmente  la  funcion  salida  (S)  de  un  transductor,  que  recibe  la  cadena 
de  entrada  y  entrega  la  salida  que  producira  el  transductor.  Ayuda:  defina 
S(w )  =  T(s,w),  donde  T(q,w)  depende  del  estado  actual  del  transductor,  y 
luego  considere  los  casos  w  —  £  y  w  —  a  ■  w',  es  decir  la  letra  a  concatenada  con 
cl  resto  de  la  cadena,  w'. 

(c)  El  lenguaje  de  salida  de  un  transductor  es  el  conjunto  de  cadenas  que  puede 
producir  (es  decir  {S(w),  w  G  S*}).  Demuestre  que  cl  lenguaje  de  salida  de  un 
transductor  es  regular.  Ayuda:  dado  un  transductor,  muestre  como  obtener  cl 
AFND  que  reconozca  lo  que  el  transductor  podria  generar. 

Cl  2001  Demuestre  que  si  L  es  un  lenguaje  regular  entonces  el  lenguaje  de  los  prefijos 
reversos  de  cadenas  de  L  tambien  es  regular.  Formalmente,  demuestre  que  L'  = 
{xR,  3 y,  xy  e  L}  es  regular. 

Cl  2001  Intente  usar  cl  Lerna  de  Bombeo  sin  la  restriccion  \xy\  <  N  para  probar  que 
L  =  {w  E  {a,  b}*,  w  =  wR}  no  es  regular.  ^Por  que  falla?  Hagalo  aliora  con  el  Lema 
con  la  restriccion. 
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Cl  2002  Dada  la  expresion  regular  (AA I  AT)  ( (AG  I  AAA)*),  realice  lo  siguiente  usando  los 
metodos  vistos: 

(a)  Construya  el  automata  finito  no  determimstico  que  la  reconoce. 

(A)  Convierta  el  automata  obtenido  a  determimstico. 

Cl  2004  Considere  la  expresion  regular  (AB  |  CD)  *AFF*. 

(a)  Construya  cl  AFND  correspondiente. 

( b )  Convierta  el  AFND  en  AFD.  Ornita  el  estado  sumidero  y  las  aristas  que  llevan  a 

el.  El  resultado  tiene  7  estados. 

(c)  Minimice  cl  AFD,  usando  la  regia  siguiente:  si  dos  estados  q  y  q'  son  ambos  finales 

o  ambos  no  finales,  de  ellos  salen  aristas  por  las  misrnas  letras,  y  las  aristas  que 
salen  de  ellos  por  cada  letra  llevan  a  los  mismos  estados,  entonces  q  y  q'  se  pueden 
unir  en  un  mismo  estado.  Reduzca  cl  AFD  a  5  estados  usando  esta  regia. 

(d)  Convierta  el  AFD  nuevamente  en  expresion  regular. 

Cl  2004  Demuestre  que: 

1.  Si  L  es  regular,  nosubstr(L)  es  regular  (nosubstr(L)  es  el  conjunto  de  cadenas 
que  no  son  substrings  de  alguna  cadena  en  L). 

2.  Si  L  es  regular,  Ext(L)  es  regular  ( Ext(L )  es  el  conjunto  de  cadenas  con  algun 
prefijo  en  L,  Ext(L)  =  {xy,  x  G  L}). 

Ex  2005  Un  Automata  Finito  de  Doble  Direction  (AFDD)  se  comporta  similarmente  a  un 
Automata  Finito  Determimstico  (AFD),  excepto  porque  tiene  la  posibilidad  de  volver 
hacia  atras  en  la  lectura  de  la  cadena.  Es  decir,  junto  con  indicar  a  que  estado  pasa 
al  leer  un  caracter,  indica  si  se  mueve  hacia  atras  o  hacia  adelante.  El  automata 
termina  su  procesamiento  cuando  se  mueve  hacia  adelante  del  ultimo  caracter.  En  este 
momento,  acepta  la  cadena  sii  a  la  vez  pasa  a  un  estado  final.  Si  nunca  pasa  del  ultimo 
caracter  de  la  cadena,  el  AFDD  no  la  acepta.  Si  cl  AFDD  trata  de  moverse  hacia  atras 
del  primer  caracter,  este  comando  se  ignora  y  permanece  en  el  primer  caracter. 

Defina  formalmente  los  AFDDs  como  una  tupla  de  componentes;  luego  defina  lo  que  es 
una  configuration;  como  es  una  transition  entre  configuraciones;  el  concepto  de  aceptar 
o  no  una  cadena;  y  finalmente  defina  el  lcnguaje  aceptado  por  un  AFDD. 

Cl  2006  Sean  Lx  y  L2  lenguajes  regulares.  Se  define 

alt{x\X2  •  •  •  Xn ,  2/l2/2  •  •  •  Vn)  2'l?/l2'2?/2  •  •  •  ^nVu 
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y  se  define  el  lenguaje 

L  =  {alt(x,y),  x  e  Lu  ye  L2,  |x|  =  \y\} 

Demuestre  que  L  es  regular. 

Cl  2006  Sea  L  C  {a,  b}*  el  lenguaje  de  las  cadenas  donde  todos  los  bloques  de  a’s 
tienen  el  mismo  largo  (un  bloque  es  una  secuencia  de  a’s  consecutivas) .  Por  ejemplo 
bbbaabaabbaa  G  L,  abbabababba  G  L,  aaaabbaaaabaaaa  G  L,  baabbbaba  L. 

Demuestre  que  L  no  es  regular. 

Ex  2007  Se  define  un  nuevo  tipo  de  AFND  llamado  “automata  universal”,  cl  cual  acepta 
una  entrada  siempre  que  por  todos  los  caminos  posiblcs  llegue  a  un  estado  final  (y  por 
lo  rnenos  llegue  a  alguno). 

1.  ^Que  lenguaje  reconoce  el  siguiente  automata  universal? 


2.  Formalice  la  notion  de  automata  universal.  Solo  debe  indicar  la  nueva  definition 
de  C(M),  mediante  h*  y  cl  resto  de  las  definiciones  usuales. 

3.  Demuestre  que  los  lenguajes  reconocidos  por  automatas  universales  son 
exactamente  los  lenguajes  regulares. 

Cl  2008  Considere  la  expresion  regular  a(ba*)*. 

1.  Dibuje  cl  AFND  correspondiente  segun  cl  rnetodo  visto  en  clases  (Thompson). 

2.  Conviertalo  a  un  AFD  con  el  rnetodo  visto  en  clases. 

3.  Obtenga  (manualmente)  un  AFD  equivalente  con  4  estados,  y  una  expresion 
regular  alternativa  a  la  del  enunciado. 

2.12  Proyectos 

1.  Investigue  sobre  minimization  de  AFDs.  Una  posible  fuente  es  [ASU86],  desde  pagina 
135.  Otra  es  [HMU01],  section  4.4,  desde  pagina  154. 
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2.  Investigue  sobre  metodos  alternativos  a  Thompson  para  convertir  una  ER  en  AFND. 
Por  ejemplo,  cl  metodo  de  Glushkov  se  describe  en  [NR02],  seccion  5.2.2,  desde  pagina 
105. 

3.  Investigue  una  forma  alternativa  de  convertir  AFDs  en  ERs,  donde  los  estados  se  van 
eliminando  y  se  van  poniendo  ERs  cada  vez  mas  complcjas  en  las  aristas  del  automata. 
Se  describe  por  ejemplo  en  [HMU01],  seccion  3.2.2,  desde  pagina  96. 

4.  Investigue  sobre  implementation  eficiente  de  automatas.  Algunas  fuentes  son  [NR02], 
seccion  5.4,  desde  pagina  117;  y  [ASU86],  seccion  3.9,  desde  pagina  134.  Tambien 
puede  investigar  la  implcmentacion  de  las  herramientas  grep  de  Gnu  y  lex  de  Unix. 

5.  Programe  cl  ciclo  completo  de  conversion  ER  — >  AFND  — >  AFD  — >  ER. 

6.  Programe  un  buscador  eficiente  de  ERs  en  texto,  de  modo  que  reciba  una  ER  y  lea  la 
entrada  estandar,  enviando  a  la  salida  estandar  las  lineas  que  contienen  una  ocurrencia 
de  la  ER. 
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CAPITULO  2. 


LENGUAJES  REGULARES 


Capitulo  3 

Lenguajes  Libres  del  Contexto 


[LP81,  cap  3] 

En  este  capitulo  estudiaremos  una  forma  de  representation  de  lenguajes  mas  potentes 
que  los  regulares.  Los  lenguajes  libres  del  contexto  (LC)  son  importantes  porqne  sirven 
como  mecanismo  formal  para  expresar  la  gramatica  de  lenguajes  de  programacion  o  los 
semiestructurados.  Por  ejemplo  la  popular  “Backus-Naur  form”  es  esencialmente  una 
gramatica  libre  del  contexto.  Similarmente,  los  DTDs  usados  para  indicar  el  formato 
permitido  en  documentos  XML  son  esencialmente  gramaticas  qne  describen  lenguajes  LC. 
Los  lenguajes  LC  tarnbien  se  usan  en  biologfa  computational  para  modelar  las  propiedades 
qne  se  bnscan  en  secuencias  de  ADN  o  proteinas.  El  estndio  de  este  tipo  de  lenguajes 
deriva  en  la  construction  semiautomatica  de  parsers  (reconocedores)  eficientes,  los  cnales  son 
esenciales  en  la  construction  de  compiladores  e  interpretes,  asi  como  para  procesar  textos 
semiestructurados.  Una  herramienta  conocida  para  esta  construction  semiautomatica  es 
lex/yacc  en  C/Unix,  y  sus  distintas  versiones  para  otros  ambientes.  Estas  herramientas 
reciben  esencialmente  una  especificacion  de  un  lengnaje  LC  y  prodneen  un  programa  qne 
parsea  tal  lenguaje. 

En  terminos  teoricos,  los  lenguajes  LC  son  interesantes  porqne  van  mas  alia  de  la  memoria 
finita  sobre  cl  pasado  permitida  a  los  regulares,  pudiendo  almacenar  una  cantidad  arbitraria 
de  information  sobre  el  pasado,  siempre  que  esta  information  se  acceda  en  forma  de  pila.  Es 
interesante  ver  los  lenguajes  qne  resultan  de  esta  restriction. 


3.1  Gramaticas  Libres  del  Contexto  (GLCs)  [lpsi,  sec  s.ij 

Una  gramatica  libre  del  contexto  (GLC)  es  una  serie  de  reglas  de  derivacion,  produccion  o 
reescritura  qne  indican  qne  un  cierto  simbolo  puede  convertirse  en  (o  reescribirse  como)  una 
secuencia  de  otros  simbolos,  los  cnales  a  su  vez  pneden  convertirse  en  otros,  hasta  obtener 
una  cadena  del  lenguaje.  Es  una  forma  particular  de  sistema  de  reescritura,  restringida  a  que 
las  reglas  aplicables  para  reescribir  un  simbolo  son  independientes  de  lo  qne  tiene  alrededor 
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en  la  cadena  que  se  esta  generando  (de  alii  el  nombre  “libre  del  contexto”). 

Distinguiremos  entre  los  simbolos  terminates  (los  del  alfabeto  E  que  formaran  la  cadena 
final)  y  los  simbolos  no  terminates  (los  que  deben  reescribirse  como  otros  y  no  pueden  aparecer 
en  la  cadena  final).  Una  GLC  tiene  un  simbolo  inicial  del  que  parten  todas  las  derivaciones, 
y  se  dice  que  genera  cualquier  secuencia  de  simbolos  terminates  que  se  puedan  obtener  desde 
cl  inicial  mediante  reescrituras. 

Ejemplo  3.1  Consideremos  las  siguientes  reglas  de  reescritura: 

5  — >  aSb 
S  — >  £ 

donde  S  es  el  simbolo  (no  terminal)  inicial,  y  {a,  b}  son  los  simbolos  terminales.  Las  cadenas  que 
se  pueden  general'  con  esta  GLC  forman  precisamente  el  conjunto  {anbn,  n  >  0},  que  en  el  Ej.  2.22 
virnos  que  no  era  regular.  De  modo  que  este  mecanismo  permite  expresar  lenguajes  no  regulares. 

Formalicemos  aliora  lo  que  es  una  GLC  y  el  lenguaje  que  describe. 

Definicion  3.1  Una  gramatica  libre  del  contexto  (GLC)  es  una  tupla  G  =  (V,  E ,R,S), 
donde 

1.  V  es  un  conjunto  finito  de  simbolos  no  terminales. 

2.  E  es  un  conjunto  finito  de  simbolos  terminales,  V  fl  E  =  0. 

3.  S  G  V  es  el  simbolo  inicial. 

4 ■  RCFV  x  (UUE)*  son  las  reglas  de  derivation  (conjunto  finito). 

Escribiremos  las  reglas  de  R  como  A  — *g  z  o  simplemente  A  — *  z  en  vez  de  {A,  z ). 

Ahora  definiremos  formalmente  cl  lenguaje  descrito  por  una  GLC. 

Definicion  3.2  Dada  una  GLC  G  =  (V,  E,  R}  S ),  la  relacion  llcva  en  un  paso  (U  U 

E)*  x  (V  U  E)*  se  define  como 

Vx,y,  \/A  — >  z  G  R,  xAy  =^c  xzy. 


Definicion  3.3  Definimos  la  relacion  llcva  en  cero  o  mas  pasos,  como  la  clausura 

reflexiva  y  transitiva  de  =^g- 

Escribiremos  simplemente  y  cuando  G  sea  evidente. 

Notamos  que  se  puede  llevar  en  cero  o  mas  pasos  a  una  secuencia  que  aun  contiene  no 
terminales.  Las  derivaciones  que  nos  interesan  finalmente  son  las  que  llevan  del  simbolo 
inicial  a  secuencias  de  terminales. 
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Definicion  3.4  Dada  una  GLC  G  =  (V,  £ ,R,S),  definimos  el  lenguaje  generado  por  G, 
jC(G),  como 

C{G)  =  {w  e  y*>.S=>*g  w}. 


Finalmente  definimos  los  lenguajes  fibres  del  contexto  como  los  expresables  con  una  GLC. 

Definicion  3.5  Un  lenguaje  L  es  fibre  del  contexto  (LC)  si  existe  una  GLC  G  tal  que 
L  =  C{G). 

Ejemplo  3.2  ^Corno  podrian  describirse  las  secuencias  de  parentesis  bien  balanceados?  (donde 
nunca  se  han  cerrado  mas  parentesis  de  los  que  se  han  abierto,  y  al  final  los  numeros  coinciden). 
Una  GLC  que  lo  describa  es  sumamente  simple: 

S  — >  ( 5)5 
S  — >  e 

la  que  formalmente  se  escribe  como  V  =  {S'},  £  =  {(,)},  R  =  {(S,  (S)S),  (S,  e)}.  Una  derivacion 
de  la  cadena  (())()  a  partir  de  S  podrfa  ser  como  sigue: 

S  =*►  (s)s  =*►  ((s)s)s  =>  (Qs)s  =>  (0 )S  =>  (() )(S)S  =*►  (0)()S  =*►  (0)0, 

y  otra  podria  ser  como  sigue: 

s  =*►  (S)S  =>  (S)(S)S  ==►  (S)()S  =>  (5)0  ((5)5)0  (QS)Q  =►  (())()• 

Esto  ilustra  un  hecho  interesante:  existen  distintas  derivaciones  para  una  misma  cadena, 
producto  de  aplicar  las  reglas  en  distinto  orden. 

Observacion  3.1  jPuede  el  lenguaje  del  Ej.  3.2  ser  regular?  No,  pues  entonces  su 
interseccion  con  (*)*  tambien  lo  seria,  pero  esa  interseccion  es  {(n)n,  n  >  0},  que  ya  sabemos 
que  no  es  regular. 

Lina  herramienta  muy  util  para  visualizar  derivaciones,  y  que  se  independiza  del  orden 
en  que  se  aplican  las  reglas,  es  cl  arbol  de  derivacion. 

Definicion  3.6  Un  arbol  de  derivacion  para  una  gramatica  G  =  (V,  £,  R ,  S)  es  un  arbol 
donde  los  hijos  tienen  orden  y  los  nodos  estan  rotulados  con  elementos  de  V  6  £  6  e.  La 
raiz  esta  rotulada  con  S,  y  los  nodos  infernos  deben  estar  rotulados  con  elementos  de  V .  Si 
los  rotulos  de  los  hijos  de  un  nodo  interno  rotulado  A  son  cp  . . .  a^,  k  >  1  y  ai  e  V  U  £,  debe 
existir  una  regia  A  — >  cp . . .  oq.  e  R.  Si  un  nodo  interno  rotulado  A  tiene  un  unico  hijo 
rotulado  e,  debe  haber  una  regia  A  — >  e  e  R.  Diremos  que  el  arbol  genera  la  cadena  que 
resulta  de  concatenar  todos  los  simbolos  de  sus  hojas,  de  izquierda  a  derecha,  vistos  como 
cadenas  de  largo  1  (o  cero  para  e). 
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Observar  que  la  definition  permite  que  un  arbol  de  derivation  tenga  simbolos  no 
terminales  en  sus  hojas,  es  decir,  puede  representar  una  derivacion  parcial.  El  siguiente 
lerna  es  inmediato. 

Lema  3.1  Si  un  arbol  de  derivacion  para  G  genera  x  G  (V  US)*,  entonces  S  x.  Si 
S  x,  existe  un  arbol  de  derivacion  que  genera  x. 

Prueba:  Muy  facil  por  induction  estructural  sobre  el  arbol  o  por  induction  sobre  la  longitud  de 
la  derivacion,  segrin  el  caso.  □ 

Ejemplo  3.3  El  arbol  de  derivacion  para  la  cadena  del  Ej.  3.2  es  conro  sigue: 


(  s  )  S  (  S  )  s 


e  e  e  e 

y  abstrae  de  ambos  ordenes  de  derivacion. 

Sin  embargo,  los  distintos  ordenes  de  derivacion  no  son  los  unicos  responsables  de  que 
existan  distintas  formas  de  derivar  una  misrna  cadena.  Es  posiblc  que  una  misma  cadena 
tenga  dos  arboles  de  derivacion  distintos. 

Definicion  3.7  Una  GLC  G  es  ambigua  si  existen  dos  arboles  de  derivacion  distintos  para 
G  que  generan  una  misma  cadena  w  €  C(G). 

Generalmente  ser  ambigua  es  una  propiedad  indeseable  para  una  GLC.  Veamos  un 
ejemplo  de  una  GLC  ambigua. 

Ejemplo  3.4  La  siguiente  GLC  describe  un  subconjunto  de  expresiones  aritmeticas  correctas. 

D 

DN 
0 

9 


E  - 

->•  E  +  E 

N 

E  - 

E  *  E 

N 

E  - 

(E) 

D 

E  - 

->  N 

D 

D 
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donde  V  =  {E,  N,  D},  E  es  el  smibolo  inicial,  y  todos  los  dernas  son  terminales. 

Por  ejemplo,  2  +  3*5  pertenece  al  lenguaje  generado  por  esta  GLC,  pero  tiene  dos  arboles  de 
derivacion  distintos: 


E  E 


N  E  *  E  E  +  E  N 


D 


N 


D 


N 


D 


N 


D 


N 


D 


D 


Dado  que  lo  normal  es  asignar  semantica  a  una  expresion  a  partir  de  su  arbol  de  derivacion,  el 
valor  en  este  ejemplo  puede  ser  25  6  17  segun  que  arbol  utilicemos  para  generarla. 


Cuando  se  tiene  una  gramatica  ambigua,  podemos  intentar  desambiguarla,  mediante 
escribir  otra  qne  genere  cl  mismo  lenguaje  pero  que  no  sea  ambigua. 

Ejemplo  3.5  La  siguiente  GLC  genera  el  mismo  lenguaje  que  la  del  Ej.  3.4,  pero  no  es  ambigua. 
La  tecnica  usada  ha  sido  distinguir  lo  que  son  sumandos  (o  terminos  T)  de  factores  (F),  de  rnodo 
de  forzar  la  precedencia  *,  +. 

E  — >  E  +  T 
E  — >  T 
T  — >  T  *  F 
T  — >  F 
F  — »  (E) 

F  — >  N 

Ahora  el  lector  puede  verificar  que  2  +  3*5  solo  permite  la  derivacion  que  queremos,  pues  hemos 
obligado  a  que  primero  se  consideren  los  sumandos  y  luego  los  factores. 


N 

N 

D 

D 

D 


D 

DN 

0 


9 
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3.2  Todo  Lenguaje  Regular  es  Libre  del  Contexto 

[LP81,  sec  3.2] 


Hemos  ya  mostrado  (Ej.  3.1)  que  existen  lenguajes  LC  que  no  son  regulares.  Vamos 
ahora  a  completar  esta  observation  con  algo  mas  profundo:  el  conjunto  de  los  lenguajes  LC 
incluye  al  de  los  regulares. 


Teorema  3.1  Si  L  CE*  es  un  lenguaje  regular,  entonces  L  es  LC. 

Prueba:  Lo  demostramos  por  induction  estructural  sobre  la  ER  que  genera  L.  Seria  mas  facil 
usando  automatas  finitos  y  de  pila  (que  veremos  enseguida),  pero  esta  demostracion  ilustra  otros 
hechos  utiles  para  mas  adelante. 

1.  Si  L  =  0,  la  GLC  G  =  ({S'},  X,  0,  S)  genera  L.  jEsta  es  una  GLC  sin  reglas! 

2.  Si  L  =  {a},  la  GLC  G  =  ({S'},  X,  {S  — >  a},  S )  genera  L. 

3.  Si  L  =  L\  U  L2  y  tenemos  (por  hipotesis  inductiva)  GLCs  G 1  =  (V},  X,  R\,  S})  y  G2  = 
(V2,  X,  R2 ,  S2)  que  generan  L\  y  L2  respectivamente,  entonces  la  GLC  G  =  (V\  U  V2  U 
{5},  X,  R\  U  i?2  U  {S  — >  Si,  S  — >  S2},  S )  genera  L. 

4.  Si  L  =  L\  o  L2  y  tenemos  GLCs  G\  =  (VR  X,  R\,  S})  y  G2  =  (V2,  X,  R2,  S'2)  que  generan  L\ 

y  L2  respectivamente,  entonces  la  GLC  G  =  (Vj  U  V2  U  {5},  X,  R\  U  R2  U  {S  — >  S1S2},  S) 

genera  L. 

5.  Si  L  =  L\  y  tenemos  una  GLC  G\  =  (Vj,  X,  R\,  SR)  que  genera  L\,  entonces  la  GLC  G  = 
(Vi  U  {S’},  X,  l?i  U  {S  — >  S\S,  S  — >  e},  S)  genera  L. 

□ 


Ejemplo  3.6  Si  derivamos  una  GLC  para  (a  * 


b)  *  a  obtendremos 


s  - 

-r  S!S2 

Si  - 

Si  - 

£ 

S3  - 

S4 

S3  - 

s§ 

s^  - 

S6S4 

s4  - 

£ 

Sfj  - 

CL 

S5  - 

b 

S2  - 

a 

El  Teo.  3.1  nos  muestra  como  convertir  cualquier  ER  en  una  GLC.  Con  esto  a  mano,  nos 
pcrmitiremos  escribir  ERs  en  los  lados  derechos  de  las  reglas  de  una  GLC. 

Ejemplo  3.7  La  GLC  del  Ej.  3.5  se  puede  escribir  de  la  siguiente  forma. 

E  +  T  |  T 
T  *  F  \  F 
(E)  |  DD  -k 
0  | ...  |  9 

si  bien,  para  cualquier  proposito  formal,  deberemos  antes  convertirla  a  la  forma  basica. 
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Ejemplo  3.8  Tal  como  con  ERs,  no  siempre  es  facil  diseriar  una  GLC  que  genere  cierto  lenguaje. 
Un  ejercicio  interesante  es  {re  €  {a,b}*,  vj  tiene  la  misma  cantidad  de  a's  y  6’s  }.  Una  respuesta 
sorprendentemente  sencilla  es  S  — >  e  \  aSbS  \  bSaS.  Es  facil  ver  por  induction  que  genera 
solamente  cadenas  correctas,  pero  es  un  buen  ejercicio  convencerse  de  que  genera  todas  las  cadenas 
correctas. 


3.3  Automatas  de  Pila  (AP)  [lpsi,  sec  s.s] 

Tal  como  en  el  Capitulo  2,  donde  teniamos  un  mecanismo  para  generar  lenguajes  regulares 
(las  ERs)  y  otro  para  reconocerlos  (AFDs  y  AFNDs),  tendremos  mecanismos  para  generar 
lenguajes  LC  (las  GLCs)  y  para  reconocerlos.  Estos  ultimos  son  una  extension  de  los 
AFNDs,  donde  ademas  de  utilizar  el  estado  del  automata  como  memoria  del  pasado,  es 
posible  almacenar  una  cantidad  arbitraria  de  simbolos  en  una  pila. 

Un  automata  de  pila  (AP)  se  diferencia  de  un  AFND  en  que  las  transiciones  involucran 
condiciones  no  solo  sobre  la  cadena  de  entrada  sino  tambien  sobre  los  simbolos  que  hay  en 
cl  tope  de  la  pila.  Asimismo  la  transition  puede  involucrar  realizar  cambios  en  cl  tope  de  la 
pila. 

Ejemplo  3.9  Consideremos  el  siguiente  AP: 

a,_j#  b,#,_ 

b,#,_ 


Las  transiciones  se  leen  de  la  siguiente  rnanera:  (a,  #)  significa  que,  al  leerse  una  a, 

independientemente  de  los  caracteres  que  haya  en  el  tope  de  la  pila  (_),  se  apilara  un  simbolo 
#  y  se  seguira  la  transition;  (b,  #,  _)  significa  que,  al  leerse  una  b ,  si  hay  un  simbolo  #  en  el  tope  de 
la  pila,  se  desapilara  (es  decir,  se  reemplazara  por  _,  que  denota  la  cadena  vacia  en  los  dibujos).  El 
AP  acepta  la  cadena  solo  si  es  posible  llegar  a  un  estado  final  habiendo  consumido  toda  la  entrada 
y  quedando  con  la  pila  vacia.  Es  facil  ver  que  el  AP  del  ejemplo  acepta  las  cadenas  del  lenguaje 
{anbn,  n  >  0}.  Notar  que  el  estado  0  es  final  para  poder  aceptar  la  cadena  vacia. 

Observation  3.2  Notar  que  una  condicion  _  sobre  la  pila  no  quiere  decir  que  la  pila  debe 
estar  vacia.  Eso  no  se  puede  expresar  directamente.  Lo  que  se  puede  expresar  es  “en  el  tope 
de  la  pila  deben  estar  estos  caracteres” .  Cuando  esa  condicion  es  _  lo  que  se  esta  diciendo 
es  que  no  hay  ninguna  condicion  sobre  el  tope  de  la  pila,  es  decir,  que  los  cero  caracteres  del 
tope  de  la  pila  deben  formar  e,  lo  que  siempre  es  cierto. 

Ejemplo  3.10  ^Corno  seria  un  AP  que  reconociera  las  cadenas  de  {wcwR ,  w  €  {a,  6}*}?  Esta 
vez  debemos  recordar  que  caracter  vimos  antes,  no  basta  con  apilar  contadores 
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Una  pregunta  un  poco  mas  complicada  es:  ^como  aceptar  {wwR,  w  €  {a,  6}*}?  jEsta  vez 
no  tenemos  una  marca  (c)  que  nos  indique  cuando  empezar  a  desapilar!  La  solucion  se  basa  en 
explotar  el  no  determinismo  intrfnseco  de  los  APs: 


De  este  modo  cl  AP  adivina  que  transicion  elegir  (es  decir  cuando  empezar  a  desapilar), 
tal  como  lo  hacfan  los  AFNDs. 

Algunas  veces  es  mas  facil  disenar  un  AP  que  una  GLC  para  describir  un  cierto  lenguaje. 
Por  ejemplo,  sin  entrenamiento  previo  no  es  sencillo  dibujar  un  AP  qne  reconozca  el  lenguaje 
del  Ej.  3.5,  mientras  que  cl  siguiente  ejemplo  muestra  la  situacion  opuesta. 

Ejemplo  3.11  Generar  un  AP  que  reconozca  el  lenguaje  del  Ej.  3.8  es  bastante  mas  intuitivo,  y 
es  mas  facil  ver  que  funciona  correctamente.  Esencialmente  el  AP  almacena  en  la  pila  el  exceso  de 
a’s  sobre  V s  o  viceversa.  Cuando  la  pila  esta  vacfa  las  cantidades  son  iguales.  Sino,  la  pila  deberi'a 
contener  solo  a’s  o  solo  b's.  La  idea  es  que,  cuando  se  recibe  una  a  y  en  el  tope  de  la  pila  hay  una 
b,  se  “cancelan”  consumiendo  la  a  y  desapilando  la  b,  y  viceversa.  Cuando  se  reciba  una  a  y  en  la 
pila  haya  exceso  de  a’s,  se  apila  la  nueva  a,  y  lo  mismo  con  b.  El  problema  es  que  debe  ser  posible 
apilar  la  nueva  letra  cuando  la  pila  esta  vacfa.  Como  no  puede  expresarse  el  hecho  de  que  la  pila 
debe  estar  vacfa,  presentamos  dos  soluciones  al  problema. 


b,Z,bZ 


3.3.  AUTO  MATAS  DE  PITA  (AP) 
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Comencemos  por  el  AP  de  la  izquierda.  Este  AP  puede  siempre  apilar  la  letra  que  viene  (en 
particular,  si  la  pila  esta  vacia).  Puede  apilar  incorrectamente  una  a  cuando  la  pila  contiene  6’s, 
en  cuyo  caso  puede  no  aceptar  una  cadena  que  pertenece  al  lenguaje  (es  decir,  puede  quedar  con 
la  pila  no  vacia,  aunque  esta  contenga  igual  cantidad  de  a’s  y  6’s).  Sin  embargo,  debe  notarse  que 
el  AP  es  no  deterministico,  y  basta  con  que  exista  una  secuencia  de  transiciones  que  termine  en 
estado  final  con  la  pila  vacia  para  que  el  AP  acepte  la  cadena.  Es  decir,  si  bien  hay  caminos  que  en 
cadenas  correctas  no  vacian  la  pila,  siempre  hay  caminos  que  lo  hacen,  y  por  ello  el  AP  funciona 
correct  amente. 

El  AP  de  la  derecha  es  rnenos  sutil  pero  es  mas  facil  ver  que  es  correcto.  Adernas  ilustra  una 
tecnica  bastante  comun  para  poder  detectar  la  pila  vacia.  Primero  se  apila  un  simbolo  especial  Z, 
de  rnodo  que  luego  se  sabe  que  la  pila  esta  realmente  vacia  cuando  se  tiene  Z  en  el  tope.  Ahora 
las  transiciones  pueden  indicar  precisamente  que  hacer  cuando  viene  una  a  segun  lo  que  haya  en  el 
tope  de  la  pila:  6  (cancelar),  a  (apilar)  y  Z  (apilar);  similarmente  con  b.  Observese  como  se  indica 
el  apilar  otra  a  cuando  viene  una  a:  la  a  del  tope  de  la  pila  se  reemplaza  por  aa.  Finalmente,  con 
la  pila  vacia  se  puede  desapilar  la  Z  y  pasar  al  estado  final. 

Es  hora  de  definir  formalmente  un  AP  y  su  funcionamiento. 

Definition  3.8  Un  automata  de  pila  (AP)  es  una  tupla  M  =  (. K ,  E,  T,  A,  s,  F),  tal  que 

•  K  es  un  conjunto  finito  de  estados. 

•  E  es  un  alfabeto  finito. 

•  T  es  el  alfabeto  de  la  pila,  finito. 

•  s  e  K  es  el  estado  initial. 

•  F  C  K  son  los  estados  finales. 

•  A  (Zp  (K  xE’x  T*)  x  (K  x  T*),  conjunto  finito  de  transiciones. 


Las  transiciones  ((q,  x,  a),  (</,  (3))  son  las  que  hemos  graficado  como  flechas  rotuladas 
“x,  a,  /3”  que  va  de  q  a  q',  y  se  pueden  recorrer  cuando  viene  x  en  la  entrada  y  se  lee  a  (de 
arriba  hacia  abajo)  en  cl  tope  de  la  pila,  de  modo  que  al  pasar  a  q'  ese  a  se  reemplazara  por 

fi. 

Ejemplo  3.12  El  segundo  AP  del  Ej.  3.11  se  describe  formalmente  como  M  =  ( K ,  E,  T,  A,  s,  F ), 
donde  I\  =  {0, 1,  2},  E  =  {a,  6},  T  =  {a,  b,  Z},  s  =  0,  F  =  {2},  y 

A  =  {  ((0,  £,£),  (1,Z)),  ((l,e,  Z),  (2,e)), 

((l,a,6),  (l,e)),  ((l,a,a),(l,aa)),  ((1,  a,  Z),  (1,  aZ)), 

((l,6,o),  (l,e)),  ((1,6, 6),  (1,66)),  ((1, 6,  Z),  (1,  bZ))  } 
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Nuevamente  definiremos  la  notion  de  configuration,  que  contiene  la  information  necesaria 
para  completar  el  computo  de  un  AP. 

Definicion  3.9  Una  configuration  de  un  AP  M  =  (K,  E,  T,  A,  s,  F )  es  un  elemento  de 
CM  =  K  xE’xP. 

La  idea  es  que  la  configuration  (q,  x,  7)  indica  que  M  esta  en  el  estado  q,  lc  falta  leer  la 
cadena  x  de  la  entrada,  y  el  contenido  completo  de  la  pila  (de  arriba  hacia  abajo)  es  7.  Esta 
es  information  suficiente  para  predecir  lo  que  ocurrira  en  el  futuro. 

Lo  siguiente  es  describir  como  cl  AP  nos  lleva  de  una  configuration  a  la  siguiente. 

Definicion  3.10  La  relacion  lleva  en  un  paso,  \~mQ  Cm  x  Cm,  para  un  AP  M  = 
(K,  E,  T,  A,  s,  F),  se  define  de  la  siguiente  manera:  ( q,xy,a^ )  \~M  (q',y,/3 7)  sii 
l{q,x,a),  (q',(3))  G  A. 

Definicion  3.11  La  relacion  lleva  en  cero  o  mas  pasos  \~*M  es  la  clausura  refilexiva  y 
transitiva  de  h  m- 

Escribiremos  simplemente  h  y  b*  en  vez  de  \~M  y  \~*M  cuando  quede  claro  de  que  M 
estamos  hablando. 

Definicion  3.12  El  lenguaje  aceptado  por  un  AP  M  =  (. K ,  E,  T,  A,  s ,  F)  se  define  como 
£(M)  =  {xeE*,  3feF,  (s,x,e) 


Ejemplo  3.13  Tomemos  el  segundo  AP  del  Ej.  3.10,  el  que  se  describe  formalmente  como 
M  =  (K,  E,  r,  A,  s,  F),  donde  K  =  {0,1},  E  =  T  =  {a,  6},  s  =  0,  F  =  {1},  y  A  = 
{((0,a,e),  (0,a)),  ((0, 6,  e),  (0, 6)),  ((0,e,e),  (l,e)),  ((l,a,a),  (l,e)),  ((1,  b,  b),  (1,  e))}. 

Consideremos  la  cadena  de  entrada  x  =  abbbba  y  escribamos  las  configuraciones  por  las  que 
pasa  M  al  recibir  x  como  entrada: 


(0,  abbbba,  e)  b  (0,6666a,  a)  h  (0,666a,  6a)  h  (0,66a,  66a) 
b  (1,66a,  66a)  b  (1,6a,  6a)  b  (l,a,  a)  b  (l,e,e). 

Por  lo  tanto  (0,  x,  e)  b*  (1,  e,  e),  y  como  1  G  F,  tenemos  que  x  €  C(M).  Notar  que  existen  otros 
caminos  que  no  llevan  a  la  configuracion  en  que  se  acepta  la  cadena,  pero  tal  como  los  AFNDs,  la 
definicion  indica  que  basta  que  exista  un  camino  que  acepta  x  para  que  el  AP  acepte  x. 


3.4.  CONVERSION  DE  GLC  A  AP 
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3.4  Conversion  de  GLC  a  AP  [lpsi,  sec  3.4] 

Vamos  a  demostrar  ahora  que  arnbos  mecanismos,  GLCs  y  APs,  son  equivalentes  para 
denotar  lcnguajes  libres  del  contexto.  Comenzaremos  con  la  conversion  mas  sencilla. 

Definition  3.13  Sea  G  =  (V,  E ,R,S)  una  GLC.  Entonces  definiremos  ap(G )  = 

(K,  E,  T,  A,  s,  F )  de  la  siguiente  manera:  K  =  {s,  /}  (es  decir  el  AP  tiene  solo  dos  estados), 
r  =  bUS  (podemos  apilar  simbolos  terminales  y  no  terminales),  F  =  {/},  y 

A  =  {((s,  £,£),(/,  S'))} 

U  {((/,  a,  a),  (/,£)),  a  e  E} 

u  {((/, A  A ),  (f,  z )),  A  — >  ze  R} 


La  idea  de  ap(G)  es  que  mantiene  en  la  pila  lo  que  aiin  espera  leer.  Esto  esta  expresado 
corno  una  secuencia  de  terminales  y  no  terminales.  Los  terminales  deben  verse  tal  como 
aparecen,  y  “ver”  un  no  terminal  significa  ver  cualquier  cadena  de  terminales  que  se  pueda 
derivar  de  el.  Por  ello  comienza  indicando  que  espera  ver  S,  cancela  un  terminal  de  la 
entrada  con  el  que  espera  ver  segun  la  pila,  y  puede  cambiar  un  no  terminal  del  tope  de 
la  pila  usando  cualquier  regia  de  derivation.  Notese  que  basta  un  AP  de  dos  estados  para 
simular  cualquier  GLC.  Esto  indica  que  los  estados  no  son  la  parte  importante  de  la  memoria 
de  un  AP,  sino  su  pila. 

Ejemplo  3.14  Dibujemos  ap(G )  para  la  GLC  del  Ej.  3.1.  El  AP  resultante  es  bastante  distinto 
de  los  que  mostramos  en  el  Ej.  3.9. 

a,a,_ 


b,b,_ 


Tambien  es  ahora  muy  facil  generar  el  AP  para  la  GLC  del  Ej.  3.5,  lo  cual  originalmente  no  era 
nada  sencillo. 

Obtener  cl  AP  de  una  GLC  es  cl  primer  paso  para  poder  hacer  el  parsing  de  un  lenguaje 
LC.  Demostraremos  ahora  que  esta  construction  es  correcta. 
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Teorema  3.2  Sea  G  una  GLC,  entonces  C[G)  =  C{ap(G)). 

Prueba:  El  invariante  es  que  en  todo  momento,  si  x  es  la  cadena  ya  leida  y  7  es  el  contenido  de 
la  pila,  entonces  S  ary.  Este  invariante  se  establece  con  la  primera  transicion  de  s  a  /.  Si  en 
algun  momento  se  ha  leido  toda  la  entrada  x  y  la  pila  esta  vacia,  es  inmediato  que  a :  C(G).  Es  muy 

facil  ver  que  los  dos  tipos  de  transicion  mantienen  el  invariante,  pues  las  que  desapilan  terminales 
de  la  entrada  simplemente  mueven  el  primer  caracter  de  7  al  final  de  x,  y  las  que  reemplazan  un 
no  terminal  por  la  parte  derecha  de  una  regia  ejecutan  un  paso  de  =>g-  Con  esto  demostramos 
que  x  €  C(ap(G))  =7-  x  €  £(G),  es  decir  toda  cadena  aceptada  por  el  AP  es  generada  por  la  GLC. 
Para  ver  la  vuelta,  basta  considerar  una  secuencia  de  pasos  que  genere  x  desde  S,  donde  el 

no  terminal  que  se  expanda  siempre  sea  el  de  mas  a  la  izquierda.  Se  puede  ver  entonces  que  el  AP 
puede  realizar  las  transiciones  consumiendo  los  terminales  que  aparecen  al  comienzo  de  la  cadena 
que  se  va  derivando  y  reemplazando  los  no  terminales  del  comienzo  por  la  misma  regia  que  se  usa 
en  la  derivation  de  x.  □ 


3.5  Conversion  a  AP  a  GLC  [lpsi,  sec  3.4] 

Esta  conversion  es  un  poco  mas  complicada,  pero  imprescindible  para  demostrar  la 
equivalencia  entre  GLCs  y  APs.  La  idea  es  generar  una  gramatica  donde  los  no  terminales 
son  de  la  forma  (p,  A,  q)  y  expresen  el  objetivo  de  llegar  del  estado  p  al  estado  q,  partiendo 
con  una  pila  que  contiene  cl  sfmbolo  A  y  terminando  con  la  pila  vacia.  Permitiremos  tambien 
objetivos  de  la  forma  (p,  e,  q ),  que  indican  llegar  de  p  a  q  partiendo  y  terminando  con  la  pila 
vacia.  Usando  las  transiciones  del  AP,  reescribiremos  algunos  objetivos  en  terminos  de  otros 
de  todas  las  formas  posibles. 

Para  simplificar  este  proceso,  supondremos  que  el  AP  no  pone  condiciones  sobre  mas  de 
un  simbolo  de  la  pila  a  la  vez. 


Definicion  3.14  Un  AP  simplificado  M  =  (K,  E,  T,  A,  s,  F)  cumple  que  ((p,  x,  a),  (q,  /3))  G 
A  =7-  I  Or  I  <  1. 


Es  facil  “simplificar”  un  AP.  Basta  reemplazar  las  transiciones  de  tipo 
((p,  x,  aia2a3),  (q,  /3))  por  una  secuencia  de  estados  nuevos:  ((p,  x,  oq),  (pi,  e)), 

((pi,  e,  a2),  (p2,  e)),  ((p2,  e,  a3),  (q,  /3)).  Ahora  definiremos  la  GLC  que  se  asocia  a  un 
AP  simplificado. 


Definicion  3.15  Sea  M  =  (K,  E,  T,  A,  s,  F)  un  AP  simplificado.  Entonces  la  GLC 
glc(M)  =  (V,  E,  R,  S)  se  define  como  V  =  {A}  U  (K  x  (fU  {e})  x  K),  y  las  siguientes 


3.5.  CONVERSION  A  AP  A  GLC 
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reglas. 

R  =  {s— feF} 
u  {( p,e,p ) — >e,  peK} 

U  {(p,  A,  r)  — >  x(q,  e,  r),  ((p,  x,  A),  (q,  e))  E  A,  r  E  K } 

U  {(p,  e,  r)  — >  x(q,  £,  r ),  ((p,  x,  e),  (q,  e))  E  A,  re  AT} 

U  {(p,Ar) — >x(q,A,r ),  ((p,x,e),  (g,e))  e  A,  r  e  A',  AgT} 

U  {(p,A,r)  — >  x(g,  5i,ri)(ri,S2,r2)  •  •  •  {rk-i,Bk,r), 

(ip,  x,  A),  (q,  BiB2  . . .  Bk))  E  A,  n,  r2,  ■■■,  rk- 1,  r  G  A'} 
U  {(p,e,r)  — >  x(g,JB1,ri)(ri,JB2,r2) . . .  (rk-i,Bk,r), 

((p,x,E),(q,B1B2. .  .Bk))  E  A,  rq,  r2,  ■  ■  ■ ,  rk-\,  r  E  K} 
U  {(p,A,r)  — y  x(q,Bl,ri)(ri,B2,r2)  ■  ■  ■  (rfc_i,  Bk,  rk){rk,  A,  r), 
((p,x,E),  (i q,BxB2  .  ..Bk))  E  A,  r1,r2, . .  .,rk,r  E  K} 


Vamos  a  explicar  ahora  el  funcionamiento  de  glc(M). 

Teorema  3.3  Sea  M  un  AP  simpliftcado ,  entonces  C(M)  =  C(glc(M)). 

Prueba:  Como  se  explico  antes,  las  tuplas  (p.  A,  q)  o  (p,  e,  q )  representan  objetivos  a  cumplir,  o 
tambien  el  lenguaje  de  las  cadenas  que  llevan  de  p  a  q  eliminando  A  de  la  pila  o  yendo  de  pila  vaci'a 
a  pila  vacia,  respectivamente.  La  primera  linea  de  R  establece  que  las  cadenas  que  acepta  el  AP 
son  las  que  lo  llevan  del  estado  inicial  s  hasta  algun  estado  final  f  E  F,  partiendo  y  terminando 
con  la  pila  vacia.  La  segunda  linea  establece  que  la  cadena  vacia  me  lleva  de  p  a  p  sin  alterar  la 
pila  (es  la  unica  forma  de  eliminar  no  terminales  en  la  GLC).  La  tercera  linea  dice  que,  si  queremos 
pasar  de  p  a  algun  r  consumiendo  A  de  la  pila  en  el  camino,  y  tenemos  una  transicion  del  AP 
que  me  lleva  de  p  a  q  consumiendo  x  de  la  entrada  y  A  de  la  pila,  entonces  una  forma  de  cumplir 
el  objetivo  es  general-  x  y  luego  ir  de  q  a  r  partiendo  y  terminando  con  la  pila  vacia.  La  cuarta 
linea  es  similar,  pero  la  transicion  no  altera  la  pila,  por  lo  que  me  sirve  para  objetivos  del  tipo 
(p,e,r).  Sin  embargo,  podria  usar  esa  transicion  tambien  para  objetivos  tipo  ( p,A,q ),  si  paso  a 
q  y  dejo  corno  siguiente  objetivo  (q,A,r)  (quinta  linea).  Las  ultimas  tres  lineas  son  analogas  a 
las  lineas  3—5,  esta  vez  considerando  el  caso  mas  complejo  en  que  la  transicion  no  elimina  A  de  la 
pila  sino  que  la  reemplaza  por  B\B2  . . .  Bk.  En  ese  caso,  el  objetivo  de  ir  de  p  a  r  se  reemplaza 
por  una  secuencia  de  objetivos,  cada  uno  de  los  cuales  se  encarga  de  eliminar  una  de  las  A*  de 
la  pila  por  vez,  pasando  por  estados  intermedios  desconocidos  (y  por  eso  se  agregan  reglas  para 
usar  todos  los  estados  intermedios  posibles).  Esto  no  constituye  una  demostracion  sino  mas  bien 
una  explicacion  intuitiva  de  por  que  glc(M)  deberia  funcionar  como  esperamos.  Una  demostracion 
basada  en  induction  en  el  largo  de  las  derivaciones  se  puede  encontrar  en  el  libro  [LP81] .  □ 

Ejemplo  3.15  Calculemos  glc(M)  para  el  AP  de  la  izquierda  del  Ej.  3.11,  que  tiene  un  solo 
estado.  La  GLC  resultante  es 
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S 

<0,e,0> 
(0,6,0) 
(0,  £,  0) 
(0,  a,  0) 
(0,6,0) 
(0,  a,  0) 
(0,6,0) 
(0,6,0) 
(0,  a,  0) 


(0,6,0) 

6 

a(0,  e,  0) 
a(0,  a,  0) 
a(0,  a,  0)  (0,  a,  0) 
a( 0,  a,  0)  (0,  6, 0) 
6(0, 6,0) 

6(0, 6,0) 

6(0, 6,0)  (0,6,0) 
6(0, 6, 0)(0,  a,  0) 


primer  a  linea  Def.  3.15 
segunda  linea  Def.  3.15 
generada  por  ((0,  a,  6),  (0,  e)) 
generadas  por  ((0,  a,  s),  (0,  a)) 


generada  por  ((0,  6,  a),  (0,  e)) 
generadas  por  ((0,  6,  e),  (0,  6)) 


Para  hacer  algo  de  luz  sobre  esta  GLC,  podemos  identificar  (0, 6,  0)  con  S,  y  llamar  B  a  (0,  a,  0) 
yia  (0,6,0).  En  ese  caso  obtendremos  una  solucion  novedosa  al  problema  original  del  Ej.  3.8. 


S  — >■  e  |  aB  |  bA 
A  — >  aS  |  bAA  |  aBA 
B  — >  bS  \  aBB  \  bAB 

Es  facil  comprender  como  funciona  esta  gramatica  que  hemos  obtenido  automaticamente.  A 
representa  la  tarea  de  generar  una  a  de  mas,  B  la  de  generar  una  6  de  mas,  y  S  la  de  producir 
una  secuencia  balanceada.  Entonces  S  se  reescribe  como:  la  cadena  vacia,  o  bien  generar  una 
a  y  luego  compensarla  con  una  B,  o  bien  generar  una  6  y  luego  compensarla  con  una  A.  A  se 
reescribe  como:  compensar  la  a  y  luego  generar  una  secuencia  balanceada  S ,  o  bien  generar  una 
6  (aumentando  el  desbalance)  y  luego  compensar  con  dos  A’s.  Similarmente  con  B.  Las  terceras 
alternativas  A  — ?•  aBA  y  B  — bAB  son  redundantes.  Observar  que  provienen  de  apilar  una  letra 
incorrectamente  en  vez  de  cancelarla  con  la  letra  de  la  pila,  como  se  discutio  en  el  Ej.  3.11. 


Ejemplo  3.16  Repitamos  el  procedimiento  para  el  AP  del  Ej.  3.9.  Este  tiene  dos  estados,  por  lo 
que  la  cantidad  de  reglas  que  se  generaran  es  mayor. 


S 

S 

(0,6,0) 

(M,  i) 

(0,6,0) 

(0,6,1) 

(0,#,0) 

(0,#,0) 

(0,#,1) 

(0,  #,  1) 

(0,#,0) 

(0,#,1) 

(1,#,0) 

(1,#,1) 


(0,6,0) 
(0,6,  1) 


O(0,#,0) 

a(0,  #,  1) 

o(0,#,0)(0,#,0) 

a(0,#,l)(l,#,0) 

a(0,#,0)(0,#,l) 

a(0,  #,  1)  (1,  #,  1) 

6(1, 6,0) 

6(1,6,  1) 

6(1,  e,0) 

6(1,6,  1) 


primera  linea  Def.  3.15 
segunda  linea  Def.  3.15 
generadas  por  ((0,  a,  e),  (0,  #)) 


generadas  por  ((0,  6,  #),  (1,  e)) 
generadas  por  ((1,  6,  #),  (1,  e)) 
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Nuevamente,  simplifiquemos  la  GLC  para  comprenderla.  Primero,  se  puede  ver  que  los  no 
terminates  de  la  forma  (1,*,0)  son  inutiles  pues  reducen  siempre  a  otros  del  mismo  tipo,  de  rnodo 
que  nunca  generaran  una  secuencia  de  terminates.  Esto  demuestra  que  las  reglas  en  las  lineas  8, 
11  y  13  pueden  eliminarse.  Similarmente,  no  hay  forma  de  generar  cadenas  de  terminates  a  partir 
de  (0,  #,0),  lo  que  permite  eliminar  las  reglas  5,  7  y  9.  Podemos  deshacernos  de  no  terminates  que 
reescriben  de  una  unica  manera,  reemplazandolos  por  su  parte  derecha.  Llamando  X  =  (0,  #,  1) 
al  unico  no  terminal  sobreviviente  aparte  de  S  tenemos  la  curiosa  gramatica: 

S  — >  £ | aX 
X  — >  b  |  aXb 

la  cual  no  es  dificil  identificar  con  la  rnucho  mas  intuitiva  S  — >  e  \  aSb.  La  asimetria  que  ha 
aparecido  es  consecuencia  del  tratamiento  especial  que  recibe  la  b  que  comienza  el  desapilado  en  el 
AP  del  Ej.  3.9. 

El  siguiente  teorema  fundamental  de  los  lenguajes  LC  completa  el  cfrculo. 

Teorema  3.4  Todo  lenguaje  libre  del  contexto  puede  ser  especificado  por  una  GLC,  o 
alternativamente,  por  un  AP. 

Prueba:  Inmediato  a  partir  de  los  Teos.  3.2  y  3.3.  □ 


3.6  Teorema  de  Bombeo  [lpsi,  sec  3.5.2] 

Nuevamente,  presentaremos  una  forma  de  determinar  que  ciertos  lenguajes  no  son  LC. 
El  mecanismo  es  similar  al  visto  para  lenguajes  regulares  (Section  2.8),  si  bien  el  tipo  de 
repetitividad  que  se  produce  en  los  lenguajes  LC  es  ligeramente  mas  complejo. 

Teorema  3.5  (Teorema  de  Bombeo) 

Sea  L  un  lenguaje  LC.  Entonces  existe  un  numero  N  >  0  tal  que  toda  cadena  w  £  L 
de  largo  |w|  >  N  se  puede  escribir  como  w  =  xuyvz  de  modo  que  uv  ^  e,  \uyv\  <  N,  y 
Vn  >  0,  xunyvnz  £  L. 

Prueba:  Sea  G  =  (V,  E,  R,  S)  una  GLC  que  genera  L.  Comenzaremos  por  mostrar  que  una 

cadena  suficientemente  larga  necesita  de  un  arbol  de  derivation  suficientemente  alto.  Sea  p  = 
max{|z|,  A  — >  z  £  R}  el  largo  maximo  de  la  parte  derecha  de  una  regia.  Entonces  es  facil  ver 
que  un  arbol  de  derivation  de  altura  h  (midiendo  altura  como  la  maxima  cant.idad  de  aristas  desde 
la  raiz  hasta  una  hoja)  no  puede  producir  cadenas  de  largo  superior  a  ph.  Tomaremos  entonces 
N  =  I,  de  modo  que  toda  cadena  de  largo  >  N  tiene  un  arbol  de  derivation  de  altura  mayor  que 
\V\.  Lo  fundamental  es  que  esto  significa  que,  en  algrin  carnino  desde  la  raiz  hasta  una  hoja,  debe 
haber  un  no  terminal  repetido.  Esto  se  debe  a  que,  en  cualquier  carnino  del  arbol  de  derivation, 
hay  tantos  nodos  internos  (rotulados  por  no  terminates)  como  el  largo  del  carnino. 
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x  u  y  v  z 


Hemos  asignado  nombres  a  las  partes  de  la  cadena  que  deriva  el  arbol  de  acuerdo  a  la  partition 
w  =  xuyvz  que  realizaremos.  Observese  que,  por  ser  el  mecanismo  de  expansion  de  no  terminales 
libre  del  contexto,  cada  vez  que  aparece  A  podriamos  elegir  expandirlo  como  queramos.  En  el 
ejemplo,  la  primera  vez  elegimos  reglas  que  llevaron  A  = >*  uyv  y  la  segunda  vez  A  =^*  y.  Pero 
podriamos  haber  elegido  A  =^>*  y  la  primera  vez.  O  podriamos  haber  elegido  A  =>*  uyv  la 
segunda  vez.  En  general  podriamos  haber  generado  S  =>*  xunyvnz  para  cualquier  n  >  0. 


uyv 


Solo  queda  aclarar  que  \uyv\  <  N  porque  de  otro  modo  se  podria  aplicar  el  argumento  al 
subarbol  cuya  raiz  es  la  A  superior,  para  obtener  un  uyv  mas  corto;  y  que  uv  A  £  porque  de 
otro  modo  podriamos  repetir  el  argumento  sobre  xyz,  la  cual  aun  es  suficientemente  larga  y  por 
lo  tanto  debe  tener  un  arbol  suficientemente  alto.  Es  decir,  no  puede  ser  posible  eliminar  todos 
los  caminos  suficientemente  largos  con  este  argumento  y  terminar  teniendo  un  arbol  muy  pequeho 
para  la  cadena  que  deriva.  □ 

Ejemplo  3.17  Usemos  el  Teorema  de  Bornbeo  para  demostrar  que  L  =  { anbncn ,  n  >  0}  no  es 
LC.  Dado  el  N,  elegimos  vj  =  aNbNcN .  Dentro  de  w  el  adversario  puede  elegir  uyv  como  quiera, 
y  en  cualquier  a  de  los  casos  la  cadena  deja  de  pertenecer  a  L  si  eliminamos  u  y  v  de  w. 

Ejemplo  3.18  Otro  ejemplo  importante  es  mostrar  que  L  =  {ww,w  €  {a,  b}*}  no  es  LC.  Para 
ello,  tomemos  w  =  aNbN aNbN  €  L.  Debido  a  que  \uyv\  <  N,  el  adversario  no  puede  elegir  u 
dentro  de  la  primera  zona  de  a's  (o  6’s)  y  v  dentro  de  la  segunda.  Cualquier  otra  election  hara  que 
xyz  A  L. 
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3.7  Propiedades  de  Clausura  [lpsi,  sec  3.5. l  y  3.5.2] 

Hemos  visto  que  los  lenguajes  regulares  se  pueden  operar  de  diversas  formas  y  el  resultado 
sigue  siendo  regular  (Seccion  2.7).  Algunas  de  esas  propiedades  se  mantienen  en  los  lenguajes 
LC,  pero  otras  no. 

Lema  3.2  La  union,  concatenacion  y  clausura  de  Kleene  de  lenguajes  LC  es  LC. 

Prueba:  Basta  recordar  las  construcciones  hechas  para  demostrar  el  Teo.  3.1.  □ 

Lema  3.3  La  interseccion  de  dos  lenguajes  LC  no  necesariamente  es  LC. 

Prueba:  Considerense  los  lenguajes  Lab  =  { anbncm ,  n,m  >  0}  y  Lf,c  =  {ambncn,  n,m  >  0}. 
Esta  claro  que  ambos  son  LC,  pues  Lah  =  { anbn ,  n  >  0}  o  c*,  y  Lbc  =  a*  o  {bncn,  n  >  0}.  Sin 
embargo,  Laf,  n  Lbc  =  {anbncn,  n  >  0},  el  cual  hemos  visto  en  el  Ej.  3.17  que  no  es  LC.  □ 

Lema  3.4  El  complemento  de  un  lenguaje  LC  no  necesariamente  es  LC. 

Prueba:  L\  n  L2  =  U  Lff ,  de  nranera  que  si  el  complemento  de  un  lenguaje  LC  fuera  siempre 
LC,  entonces  el  Lema  3.3  seria  falso.  □ 

Observacion  3.3  El  que  no  siempre  se  puedan  complementar  los  lenguajes  LC  nos  dice 
que  el  hecho  de  que  los  APs  sean  no  determimsticos  no  es  superficial  (como  lo  era  el  no 
determinismo  de  los  AFNDs),  sino  un  hecho  que  dificilmente  se  podra  eliminar.  Esto 
tiene  consecuencias  importantes  para  el  uso  practico  de  los  APs,  lo  que  se  discutira  en 
las  siguientes  secciones. 

Observacion  3.4  Es  interesante  que  si  se  puede  intersectar  un  lenguaje  LC  con  uno  regular 
para  obtener  un  lenguaje  LC.  Sea  M±  =  (Ad,  S,  T,  Ai,  si,  Ff)  el  AP  y  M2  =  (K2,  £,  S,  s2,  F2) 
el  AFD  correspondientes.  Entonces  el  AP  AI  =  (K\  x  K2,  E,  T,  A,  (si,  s2),  Fx  x  F2),  con 

A  =  {({p\,P2),x,a),((qi,q2),l3)),  ((pi,x,  a),  (qi,  (3)  G  Ai,  (p2,  x)  (q2,  e)}, 

reconoce  la  interseccion  de  los  dos  lenguajes.  La  idea  es  recordar  en  los  estados  de  M  en 
que  estado  estan  ambos  automatas  simultaneamente.  El  problema  para  intersectar  dos  APs 
es  que  hacen  cosas  distintas  con  una  misma  pila,  pero  ese  problema  no  se  presenta  aqm. 

El  metodo  descrito  nos  da  tambien  una  forma  de  intersectar  dos  lenguajes  regulares  mas 
directa  que  la  vista  en  la  Seccion  2.7. 

3.8  Propiedades  Algoritmicas  [lpsi,  sec  3.5.3] 

Veremos  un  par  de  preguntas  sobre  lenguajes  LC  que  pueden  responderse 
algoritmicamente.  Las  que  faltan  con  respecto  a  los  regulares  no  pueden  responderse,  pero 
esto  se  vera  mucho  mas  adclante. 


60 


CAPITULO  3.  LENGUAJES  LIBRES  DEL  CONTEXTO 


Lema  3.5  Dado  un  lenguaje  LC  L  y  una  cadena  w,  existe  un  algoritmo  para  determinar  si 
w  G  L. 

Prueba:  Lo  natural  pareceria  ser  usar  un  AP,  pero  esto  no  es  tan  sencillo  corno  parece:  el  AP 
no  es  determimstico  y  la  cantidad  de  estados  potenciales  es  infinita  (considerando  la  pila).  Aun 
peor,  puede  pasar  mucho  tiempo  operando  solo  en  la  pila  sin  consumir  caracteres  de  la  entrada. 
No  es  facil  determinar  si  alguna  vez  consumira  la  cadena  o  no.  Utilizaremos,  en  carnbio,  una  GLC 
G  =  (V,  E,  R,  S )  que  genera  L.  La  idea  esencial  es  escribir  todas  las  derivaciones  posibles,  hasta  o 
bien  generar  w  o  bien  determinar  que  w  nunca  sera  generada.  Esto  ultimo  es  el  problema.  Para 
poder  determinar  cuando  detenernos,  modificaremos  G  de  modo  que  todas  las  producciones,  o  bien 
hagan  crecer  el  largo  de  la  cadena,  o  bien  la  dejen  igual  pero  conviertan  un  no  terminal  en  terminal. 
Si  logramos  esto,  basta  con  probar  todas  las  derivaciones  de  largo  2\w\. 

Debemos  entonces  eliminar  dos  tipos  de  reglas  de  G. 

1.  Reglas  de  la  forma  A  — e,  pues  reducen  el  largo  de  la  cadena  derivada.  Para  poder  eliminar 
esta  regia,  buscaremos  todas  las  producciones  de  la  forma  B  — >  xAy  y  agregaremos  otra  regia 
B  — >  xy  a  G,  adelantandonos  al  posible  uso  de  A  — >  e  en  una  derivation.  Cuando  hayamos 
hecho  esto  con  todas  las  reglas  que  mencionen  A  en  la  parte  derecha,  podemos  descartar 
la  regia  A  — e.  Notese  que  no  es  necesario  reprocesar  las  nuevas  reglas  introducidas 
segrin  viejas  reglas  A  — e  ya  descartadas,  pues  la  regia  paralela  correspondiente  ya  existe, 
pero  sf  deben  considerarse  para  la  regia  que  se  esta  procesando  en  este  momento.  Lo  que 
tambien  rnerece  atencion  es  que  pueden  aparecer  nuevas  reglas  de  la  forma  B  — >  e,  las 
cuales  deben  introducirse  al  conjunto  de  reglas  a  eliminar.  Este  proceso  no  puede  continuar 
indefinidamente  porque  existen  a  lo  mas  |Vj  reglas  de  este  tipo.  Incluso  el  conjunto  de  reglas 
nuevas  que  se  introduciran  esta  limitado  por  el  hecho  de  que  cada  regia  nueva  tiene  en  su 
parte  derecha  una  subsecuencia  de  alguna  parte  derecha  original.  Finalmente,  notese  que  si 
descartamos  la  regia  S  — >  £  cambiaremos  el  lenguaje,  pues  esta  regia  permitira  generar  la 
cadena  vatia  y  no  habra  otra  forma  de  generarla.  Esto  no  es  problema:  si  aparece  esta  regia, 
entonces  si  w  =  e  se  responde  w  €  L  y  se  termina,  de  otro  modo  se  puede  descartar  la  regia 
S  — >  e  ya  que  no  es  relevante  para  otras  producciones. 

2.  Reglas  de  la  forma  A  — >  B,  pues  no  aumentan  el  largo  de  la  cadena  derivada  y  no  convierten 
el  no  terminal  en  terminal.  En  este  caso  dibujamos  el  grafo  dirigido  de  que  no  terminales 
pueden  convertirse  en  otros,  de  modo  que  A  = B  sii  existe  un  camino  de  A  a  B  en  ese 
grafo.  Para  cada  uno  de  estos  caminos,  tomamos  todas  las  producciones  de  tipo  C  — >  xAy 
y  agregamos  C  — >  xBy ,  adelantandonos  al  posible  uso  de  esas  flechas.  Cuando  hemos 
agregado  todas  las  reglas  nuevas,  eliminamos  en  bloque  todas  las  reglas  de  tipo  A  — >  B. 
Nuevamente,  no  podemos  eliminar  directamente  las  reglas  de  tipo  S  — >  A,  pero  estas  se 
aplicaran  a  lo  sumo  una  vez,  corno  primera  regia,  y  para  ello  basta  permitir  derivaciones  de 
un  paso  mas. 

□ 


Lema  3.6  Dado  un  lenguaje  LC  L,  existe  un  algoritmo  para  determinar  si  L  =  0. 

Prueba:  El  punto  tiene  mucho  que  ver  con  la  demostracion  del  Teo.  3.5.  Si  la  gramatica  G  = 
(V,E,  R,  S)  asociada  a  L  genera  alguna  cadena,  entonces  puede  generar  una  cadena  sin  repetir 
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sfmbolos  no  terminales  en  el  camino  de  la  rafz  a  una  hoja  del  arbol  de  derivacion  (pues  basta 
reemplazar  el  subarbol  que  cuelga  de  la  primera  ocurrencia  por  el  que  cuelga  de  la  ultima,  tantas 
veces  como  sea  necesario,  para  quedarnos  con  un  arbol  que  genera  otra  cadena  y  no  repite  sfmbolos 
no  terminales).  Por  ello,  basta  con  escribir  todos  los  arboles  de  derivacion  de  altura  |Vj.  Si  para 
entonces  no  se  ha  generado  una  cadena,  no  se  generara  ninguna.  □ 

3.9  Determinismo  y  Parsing  [lpsi,  sec  3.6] 

Las  secciones  anteriores  levantan  una  pregunta  practica  evidente:  /,como  se  puede  parsear 
eficientemente  un  lenguaje?  El  hecho  de  que  el  no  determinismo  de  los  APs  no  sea  superficial, 
y  de  que  hayamos  utilizado  un  rnetodo  tan  tortuoso  e  ineficiente  para  responder  si  w  G  L 
en  cl  Lema  3.5,  indican  que  parsear  eficientemente  un  lenguaje  LC  no  es  algo  tan  inmediato 
como  para  un  lenguaje  regular. 

Lo  primero  es  un  resultado  que  indica  que  es  posible  parsear  cualquier  lenguaje  LC  en 
tiempo  polinomial  (a  diferencia  del  rnetodo  del  Lema  3.5). 

Definicion  3.16  La  forma  normal  de  Chomsky  para  GLCs  establece  que  se  permiten  tres 
tipos  de  reglas:  A  — >  BC ,  A  — >■  a,  y  S  — *  e,  donde  A,  B,  C  son  no  terminales,  S  es  el 
simbolo  inicial,  y  a  es  terminal.  Para  toda  GLC  que  genere  L,  existe  otra  GLC  en  forma 
normal  de  Chomsky  que  genera  L. 

Observation  3.5  Si  tenemos  una  GLC  en  forma  normal  de  Chomsky,  es  posible  determinar 
en  tiempo  0(\R\n 3)  si  una  cadena  w  G  L,  donde  n  —  \w\  y  R  son  las  reglas  de  la  gramatica. 
Esto  se  logra  mediante  programacion  dinamica,  determinando  para  todo  substring  de  w, 
Wj.Wi+i . .  .Wj,  que  no  terminales  A  derivan  ese  substring,  A  =^*  ugug+i . . .  u^.  Para 
determinar  esto  se  prueba,  para  cada  regia  A  — >  BC ,  si  existe  un  k  tal  que  B  = =^*  wl . . .  wk 
y  C  => *  wk+ 1 .  ..wj. 

Este  resultado  es  interesante,  pero  aun  no  lo  suficientemente  practico.  Realmente 
necesitamos  algoritmos  de  tiempo  lineal  para  determinar  si  w  G  L.  Esto  serfa  factible  si 
cl  AP  que  usarnos  fuera  determimstico:  en  cualquier  situation  posible,  este  AP  debe  tener  a 
lo  sumo  una  transition  a  seguir. 

Definicion  3.17  Dos  reglas  ((g,  x,  a),  ( p ,  (3 ))  ^  ((g,  x' ,  a'),  ( p ',  /?'))  de  un  AP  colisionan  si  x 
es  prefijo  de  x'  (o  viceversa)  y  a  es  prefijo  de  a'  (o  viceversa). 

Definicion  3.18  Un  AP  M  =  (K,  E,  T,  A,  s,  F)  es  determimstico  si  no  existen  dos  reglas 
(( q,x,a),(p,/3 ))  7^  ((g,  x1,  a1),  (p1,  /31))  G  A  que  colisionan. 

Lin  AP  no  determimstico  tiene  un  estado  g  del  que  parten  dos  transiciones,  de  rnodo  que 
puede  elegir  cualquiera  de  las  dos  si  en  la  entrada  viene  el  prefijo  comun  de  x  y  x',  y  en  cl 
tope  de  la  pila  se  puede  leer  cl  prefijo  comun  de  a  y  a1.  No  todo  AP  puede  convertirse  a 
determimstico. 
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Ejemplo  3.19  El  lenguaje  L  =  {amibani2b . . .  bamk,  k  >  2,  mi,  mi, . . . ,  mk  >  0,  nij  A  rn3  para 
algun  i,j}  es  LC  pero  no  puede  reconocerse  por  ningiln  AP  determimstico. 

Un  AP  determimstico  es  el  del  Ej.  3.9,  asi  como  el  de  wcwR  en  el  Ej.  3.10.  El  AP  del 
wwR  del  mismo  Ej.  3.9  no  es  determimstico,  pues  la  transition  ((0,  £,  e),  (1,£))  colisiona  con 
((0,  a,  s),  (0,  a))  y  ((0,6,e),  (0,6)). 

Lo  qne  verdaderamente  nos  interesa  es:  ^es  posible  disenar  un  metodo  para  general'  un  AP 
determimstico  a  partir  de  una  GLC?  Ya  sabemos  que  tal  metodo  no  puede  funcionar  siempre, 
pero  podemos  aspirar  a  poderlo  hacer  en  una  buena  cantidad  de  casos  “interesantes” . 

Parsing  Top-Down:  Lenguajes  LL (k) 

Volvamos  a  la  conversion  de  GLC  a  AP  del  Teo.  3.2.  La  idea  esencial  es,  dado  que  esperamos 
ver  un  cierto  no  terminal  en  la  entrada,  decidir  de  antemano  que  regia  aplicaremos  para 
convertirlo  en  otra  secuencia.  El  que  debamos  aplicar  una  regia  entre  varias  puede  introducir 
no  determinismo. 

Tomemos  el  Ej.  3.14.  El  AP  resultante  no  es  determimstico,  pues  las  transiciones 
((1,  e,  S),  (1,  e))  y  ((1,  e,  S),  (1,  aSb))  colisionan.  Sin  embargo,  no  es  dificil  determinar  cual 
es  la  que  deberiamos  seguir  en  cada  caso:  si  cl  proximo  caracter  de  la  entrada  es  una  a, 
debemos  reemplazar  la  S  que  esperamos  ver  por  aSb,  mientras  que  si  es  una  b  debemos 
reemplazarla  por  e.  Esto  sugiere  la  siguiente  modification  del  AP. 

Ejemplo  3.20  La  siguiente  es  una  version  deterministica  del  AP  del  Ej.  3.14. 


El  resultado  es  bastante  distinto  del  que  derivamos  manualmente  en  el  Ej.  3.9. 

El  mecanismo  general  es  agregar  al  estado  final  /  del  AP  generado  por  el  Teo.  3.2  los 
estados  fc,  c  G  E,  junto  con  transiciones  de  ida  ((/,  c,  e),  (/c,  £)),  y  de  vuelta  ((/c,  e,  c),  (/,  £)). 
Si  dentro  de  cada  estado  fc  podemos  determinar  la  parte  derecha  que  corresponde  aplicar  a 
cada  no  terminal  que  este  en  cl  tope  de  la  pila,  habremos  obtenido  un  AP  deterministico. 
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Definition  3.19  Los  lenguajes  LC  que  se  pueden  reconocer  con  la  construccion  descrita 
arriba  se  llaman  LL(1 ).  Si  se  pueden  reconocer  mediante  mirar  de  antemano  los  k  caracteres 
de  la  entrada  se  llaman  LL{k). 

Este  tipo  de  parsing  se  llama  “top-down1'  porque  se  puede  visualizar  como  generando 
el  arbol  de  derivation  desde  arriba  hacia  abajo,  pues  decidimos  que  production  utilizar  (es 
decir  la  raiz  del  arbol)  antes  de  ver  la  cadena  que  se  derivara. 

Esta  tecnica  puede  fracasar  por  razones  superficiales,  que  se  pueden  corregir  en  la  GLC 
de  la  que  parte  generandose  cl  AP  original. 

1.  Factorization  a  la  izquierda.  Consideremos  las  reglas  N  — y  D  y  N  — y  DN  en  la 
GLC  del  Ej.  3.5.  Por  mas  que  veamos  que  lo  que  sigue  en  la  entrada  es  un  dfgito, 
no  tenemos  forma  de  saber  que  regia  aplicar  en  un  LL(1).  Sin  embargo,  es  muy  facil 
reemplazar  estas  reglas  por  N  — y  DN',  N'  — y  e,  N'  — y  N.  En  general  si  dos  o  mas 
reglas  comparten  un  prefijo  comun  en  su  parte  derecha,  este  se  puede  factorizar. 

2.  Recursion  a  la  izquierda.  Para  cualquier  k  fijo,  puede  ser  imposible  saber  que  regia 
aplicar  entre  E  — y  E  +  T  y  E  — y  T  (basta  que  siga  una  cadena  de  T  de  largo  mayor 
que  k).  Este  problema  tambien  puede  resolverse,  mediante  reemplazar  las  reglas  por 
E  — y  TE',  E'  — y  e,  E'  — y  +TE'.  En  general,  si  tenemos  reglas  de  la  forma 
A  — y  Act,,  y  otras  A  — y  (3j,  las  podemos  reemplazar  por  A  — y  /3jA' ,  A1  — y  atiA', 
A'  — y  e. 


Ejemplo  3.21  Aplicando  las  tecnicas  descritas,  la  GLC  del  Ej.  3.5  se  convierte  en  la  siguiente, 
que  puede  parsearse  con  un  AP  determimstico  que  mira  el  siguiente  caracter. 


E 

E’ 

E' 

T 

T' 

V 

F 

F 


N 

N' 

N' 


DN' 

N 

£ 


D 

D 

D 


0 


9 


Observese  que  no  es  inmediato  que  el  AP  tipo  LL(1)  que  obtengamos  de  esta  GLC  sera 
determimstico.  Lo  que  complica  las  cosas  son  las  reglas  como  E'  — y  e.  Tal  como  esta,  la  idea  es 
que,  si  tenemos  E'  en  el  tope  de  la  pila  y  viene  un  +  en  la  entrada,  debemos  reemplazar  E'  por 
+TE' ,  mientras  que  si  viene  cualquier  otra  cosa,  debemos  eliminarla  de  la  pila  (o  sea  reemplazarla 
por  e).  En  esta  gramatica  esto  funciona.  Existe  un  metodo  general  para  verificar  que  la  GLC 
obtenida  funciona,  y  se  ve  en  cursos  de  compiladores:  la  idea  es  calcular  que  caracteres  pueden 
seguir  a  E'  en  una  cadena  del  lenguaje;  si  +  no  puede  seguirla,  es  seguro  aplicar  E'  — y  e  cuando 
el  siguiente  caracter  no  sea  +. 
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Algo  interesante  de  estos  parsers  top-down  es  que  permiten  una  implementation  manual 
mny  sencilla  a  partir  de  la  GLC.  Esto  es  lo  que  un  programador  hace  intuit ivamente  cuando 
se  enfrenta  a  un  problema  de  parsing.  A  continuation  haremos  un  ejemplo  que  solo  indica 
si  la  cadena  pertenece  al  lenguaje  o  no,  pero  este  parsing  recursivo  permite  tambien  realizar 
acciones  de  modo  de  por  ejemplo  evaluar  la  expresion  o  construir  su  arbol  sintactico.  En  un 
compilador,  lo  que  hace  el  parsing  es  generar  una  representation  intermedia  del  codigo  para 
que  despues  sea  traducido  al  lenguaje  de  maquina. 

Ejemplo  3.22  Se  puede  obtener  casi  automaticamente  un  parser  recursivo  asociado  a  la  GLC 
del  Ej.  3.21.  nextChar ()  devuelve  el  siguiente  caracter  de  la  entrada,  y  getChari)  lo  consume. 


Parsed 

if  -i  ParseT  return  false 
if  -i  Parsed'  return  false 
return  true 


Parsed 

return  ParseiV 


ParseT' 

if  nextChar ()  =  +  return  ParseTj 
return  Parsed 


Parsed 

if  -i  Parse!?  return  false 
if  -i  ParseiV'  return  false 
return  true 


Pars  eE[ 

getChar(); 

if  -i  ParseT  return  false 
if  -i  ParseT'  return  false 
return  true 

Pars  eE'2 
return  true 

. . .  ParseT  y  ParseT'  muy  similares 
ParseT 

if  nextCharf)  =  (  return  ParseTi 
return  ParseTg 

ParseTi 

getChar(); 

if  -i  ParseT  return  false 
if  nextChar  ()  ^  )  return  false 
getChar(); 
return  true 


Pars  eN' 

if  nextChar ()  €  {0 ...  9}  return  ParselVj 
return  ParselV^ 

ParseiVj 
return  ParseiV 

Parse 
return  true 

Pars  eD 

if  nextCharf)  =  0  return  ParseZ?o 

if  nextCharf)  =  9  return  ParseTg 

ParseTo 
getCharif) 
return  true 

. . .  ParseTi  a  ParseTg  similares 


Los  procedimientos  pueden  simplificarse  a  mano  significativamente,  pero  la  intention  es  enfatizar 
corno  salen  practicamente  en  forma  automatica  de  la  GLC.  ParseT  devolvera  si  pudo  parsear 
la  entrada  o  no,  y  consumira  lo  que  pudo  parsear.  Si  devuelve  true  y  consume  la  entrada 
correctamente,  esta  es  valida.  Cada  regia  tiene  su  procedimiento  asociado,  y  cada  no  terminal 
tambien.  Por  ejemplo  ParseT,/  parsea  un  E' ,  y  recurre  a  dos  reglas  posibles,  ParseTj  y  ParseTg. 
Para  elegir,  se  considera  el  siguiente  caracter. 
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Las  suposiciones  sobre  la  correctitud  de  la  GLC  para  un  parsing  determimstico  usando  el 
siguiente  caracter  se  han  trasladado  al  codigo.  Parse-E',  por  ejemplo,  supone  que  se  le  puede 
dar  la  prioridad  a  Parse-Ej,  pues  verifica  directamente  el  primer  caracter,  y  si  no  funciona  sigue  con 
Pars eE'2.  Esto  no  funcionaria  si  el  +  pudiera  eventualmente  aparecer  siguiendo  E'  en  la  derivation. 


Parsing  Bottom-Up:  Lenguajes  LR (k) 

El  parsing  top-down  exige  que,  finalmente,  seamos  capaces  de  determinar  que  regia  aplicar 
a  partir  de  ver  cl  siguiente  caracter  (o  los  siguientes  k  caracteres).  El  parsing  LR(/c)  es  mas 
flexible.  La  idea  esta  vez  es  construir  el  arbol  de  parsing  de  abajo  hacia  arriba. 

La  idea  de  este  parsing  es  que  la  pila  contiene  lo  que  cl  parser  ha  visto  de  la  entrada, 
no  lo  que  espera  ver.  Lo  que  se  ha  visto  se  expresa  como  una  secuenc-ia  de  terminates  y 
no  terminates.  En  cada  momento  se  puede  elegir  entre  apilar  la  primera  letra  de  la  entrada 
(con  lo  que  ya  la  “hemos  visto”)  o  identificar  la  parte  derecha  de  una  regia  en  la  pila  y 
reemplazarla  por  la  parte  izquierda.  Al  final,  si  hemos  visto  toda  la  entrada  y  en  la  pila  esta 
cl  simbolo  inicial,  la  cadena  pertenece  al  lenguaje. 

Definition  3.20  El  automata  de  pila  LR  (APLR)  de  una  GLC  G  =  (V,  E,  R,  S)  se  define 
como  M  =  (K,  E,  T,  A,  s,  F)  donde  K  =  {s,  f},  T  =  V  U  E,  F  =  {/}  y 

A  =  {((s,e,S),(f,e))} 

U  {((s,  a,  e),  (s,  a),  a  e  E} 

U  {((s,  e,  zR ),  (s,  A)),  A  — >  z  e  R} 


Notar  que  cl  APLR  es  una  alternativa  a  la  construction  que  hicimos  en  la  Def.  3.13, 
mas  adecuada  al  parsing  LR (k).  Los  generadores  profesionales  de  parsers  usan  el  mecanismo 
LR(fc),  pues  es  mas  potente. 

Ejemplo  3.23  Dibujemos  el  APLR  para  la  GLC  del  Ej.  3.14.  Notar  que  no  es  determimstico. 


a, _,a 

b, _,b 


e,bSa,S 
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Nuevamente  el  APLR  puede  no  ser  determimstico,  y  se  intenta  determinizar  considerando 
cl  siguiente  caracter  de  la  entrada.  Surgen  dos  tipos  de  colisiones  entre  reglas  (llamadas 
“conflictos” ) :  shift/reduce  cuando  existe  colision  entre  una  regia  que  indica  apilar  el  siguiente 
simbolo  de  la  entrada  (shift)  versus  otra  que  indica  transformar  una  parte  derecha  por 
una  izquierda  en  la  pila  (reduce)]  y  reduce/reduce  cuando  hay  dos  formas  de  reducir  partes 
derechas  a  izquierdas  en  la  pila. 

Definicion  3.21  Los  lenguajes  LC  que  se  pueden  reconocer  con  la  construccion  descrita 
arriba  se  llaman  LR(k),  donde  k  es  la  cantidad  de  caracteres  que  deben  mirarse  en  la  entrada 
para  decidir  los  conflictos. 

Ejemplo  3.24  Tomemos  la  GLC  del  Ej.  3.5  y  construyamos  el  APLR  correspondiente: 

(>->(  o,_,o 

9Z9 

z,E, 


z,T+E,E  e,)E(,F  z,0,D 
z,T,E  £,N,F 
e,F*T,T  z,D,N  e,9,D. 
e,F,T  e,ND,N 

Sigamos  un  parsing  exitoso  de  2  +  3*5: 


(0,  2  +  3  *  5,  e)  b 
b 
b 
b 
b 


(0,  +3  *  5,  2)  h  (0,  +3  *  5,  D)  h  (0,+3*5,lV)  h  (0,+3*5,F) 

(0,  +3  *  5,  T)  b  (0,  +3  *  5,  E)  b  (0,3*5,+£)  b  (0,*5,3  +  £) 

(0,  *5,11  +  E)  b  (0,  *5,  N  +  E)  b  (0,  *5,  F -\- E)  b  (0,  *5 ,T -\- E) 

(0,  5,  *T  +  E)  b  (0,£,  5  *  T E)  b  (0,  e,  D  *  T  +  E)  b  (0,e,  N*T-\-E) 
(0,  e,  F  *  T  +  E)  b  (0,  e,  T  +  E)  b  (0,  e,  E)  b  (l,e,  e) 


El  ejemplo  muestra  la  relevancia  de  los  conflictos.  Por  ejemplo,  si  en  cl  segundo  paso,  en 
vez  de  reducir  D  — »  2  (aplicando  la  regia  ((0,  £,  2),  (0,  D)))  hubieramos  apilado  el  +,  nunca 
habrfamos  logrado  reducir  toda  la  cadena  a  E.  Similarmente,  en  cl  paso  6,  si  hubieramos 
apilado  el  +  en  vez  de  favorecer  la  regia  E  — >  T,  habrfamos  fracasado.  En  cambio,  en  el 
paso  13,  debemos  apilar  *  en  vez  de  usar  la  regia  E  — >  T.  Esto  indica  que,  por  ejemplo, 
en  cl  caso  del  conflicto  shift/reduce  de  la  regia  ((0,  +,  e),  (0,  +))  con  ((0,  e,  T),  (0,  E))  debe 
favorecerse  cl  reduce,  mientras  que  en  el  conflicto  de  ((0,  *,  e),  (0,  *))  con  ((0,  e,  T),  (0,  E)) 
debe  favorecerse  el  shift.  Esto  esta  rclacionado  con  la  precedencia  de  los  operadores.  El  caso 
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de  conflictos  reduce/reduce  suele  resolverse  priorizando  la  parte  derecha  mas  larga,  lo  cual 
casi  siempre  es  lo  correcto.  Los  generadores  de  parsers  permiten  indicar  como  resolver  cada 
conflicto  posiblc  en  la  gramatica,  los  cuales  pueden  ser  precalculados. 


3.10  Ejercicios 

Gramaticas  Libres  del  Contexto 

1.  Considere  la  gramatica  G  =  ({.S',  A},  {a,  b},  R,  S),  con  R  =  {S 
AAA,  A  — »  a,  A  — >  bA,  A  — >  Ab}. 


AA,A 


(a)  ^Que  cadenas  de  C{G)  se  pueden  generar  con  derivaciones  de  cuatro  pasos  o 
menos? 

(b)  De  al  menos  cuatro  derivaciones  distintas  para  babbab  y  dibuje  los  arboles  de 
derivacion  correspondientes  (los  cuales  podrfan  no  ser  distintos). 

2.  Sea  la  gramatica  G  =  ({S',  A},  {a,  b},  R,  S),  con  R  =  {S  — *  aAa,  S  — *  bAb,  S  — > 
£,A— >SS}. 

(a)  De  una  derivacion  para  baabbb  y  dibuje  el  arbol  de  derivacion. 

(b)  Describa  C(G)  con  palabras. 

3.  Considere  el  alfabeto  E  =  {a,  b,  (, ),  |,*,  $}.  Construya  una  GLC  que  genere  todas  las 
expresiones  regulares  validas  sobre  {a,b}. 


4.  Sea  G  =  ({S},  {a,  b},  R,  S),  con  R  =  {S  — 
bSb,  S  — »  e}  Muestre  que  C(G)  es  regular. 

5.  Construya  GLCs  para  los  siguientes  lenguajes 

(a)  {ambn,  m  >  n}. 

(b)  {. ambncpdq ,  m  +  n  =  p  +  q}. 

(c)  { uawb ,  u,w  G  {a,  b}*,  |u|  =  |w|} 


aSa,  S 


aSb,  S  — ►  bSa,S 


Automatas  de  Pila 

1.  Construya  automatas  que  reconozcan  los  lenguajes  del  ejercicio  5  de  la  section  anterior. 
Hagalo  directamente,  no  transformando  la  gramatica. 

2.  Dado  el  automata  M  =  ({s,  /},  {a,  b},  {a},  A,  s,  {/}},  con 

A  =  {((s,  a,  e),  (s,  a)),  ((s,  b,  e),  ( s ,  a)),  ((s,  a,  e),  (/,  e)),  ((/,  a,  a),  (/,  e)),  ((/,  b,  a),  (/,  e))}. 
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(a)  De  todas  las  posibles  secuencias  de  transiciones  para  aba. 

(b)  Muestre  que  aba,  aa,  abb  £{M),  pero  baa,bab,baaaa  G  C(M). 

(c)  Describa  C(M)  en  palabras. 

3.  Construya  automatas  que  reconozcan  los  siguientes  lenguajes 

(a)  El  lenguaje  generado  por  G  =  ({<Sf},  {[,],(,)},  R,  S),  con  R  =  {S  — *  e,S  — * 
SS,S  — »  [S],S  — ►  (S)}. 

(b)  {ambn,  m  <  n  <  2m} 

(c)  {w  G  {a,b}*,  w  =  wR}. 

Gramaticas  y  Automatas 

1.  Considere  la  GLC  G  =  ({.S',  A,  B},  {a,  b},  R,  S ),  con  R  =  {S  — »  abA ,  S  — »  B,  S  — > 
baB ,  S  — *  e,  A  — *  bS,  B  — *  aS,  A  — *  b}.  Construya  el  automata  asociado. 

2.  Repita  el  ejercicio  1  de  la  parte  anterior,  esta  vez  obtenicndo  los  automatas 
directamente  de  la  gramatica.  Comparelos. 

3.  Considere  nuevamente  el  ejercicio  1  de  la  parte  anterior.  Obtenga,  usando  el  algoritmo 
visto,  la  gramatica  que  corresponde  a  cada  automata  que  usted  genero  manualmente. 
Comparelas  con  las  gramaticas  originates  de  las  qne  partio  cnando  hizo  ese  ejercicio. 

Lenguajes  Libres  de  Contexto 

1.  Use  las  propiedades  de  clausnra  (y  otros  ejercicios  ya  hechos)  para  probar  qne  los 
siguientes  lenguajes  son  LC. 

(a)  {. ambn ,  m  ^  n} 

(b)  {ambncpdg,  n  =  g  V  m  <  p  V  m  +  n  =  p  +  q] 

(c)  {a'nbncp,  m  —  nV  n  —  pV  m  —  p} 

(d)  {ambncp,  m^nVn^pVm^p} 

2.  Use  el  Teorema  de  Bombeo  para  probar  que  los  siguientes  lenguajes  no  son  LC. 

(a)  {ap,  p  es  primo  }. 

(b)  {an\  n  >  0}. 

(c)  {www,  w  G  {a,&}*}. 

(d)  {ambncp,  m  =  n  A  n  =  p  A  m  =  p}  (^lo  reconoce?) 

3.  Sean  Mi,M2  automatas  de  pila.  Construya  directamente  automatas  para  C(Mi)  U 

£(M2),  y  C(M1)\ 
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3.11  Preguntas  de  Controles 

A  continuation  se  muestran  algunos  ejercicios  de  controles  de  anos  pasados,  para  dar  una 
idea  de  lo  que  se  puede  esperar  en  los  proximos.  Hernos  omitido  (i)  (casi)  repeticiones,  (ii) 
cosas  que  ahora  no  se  ven,  (in)  cosas  que  ahora  se  dan  como  parte  de  la  materia  y/o  estan 
en  los  ejercicios  anteriores.  Por  lo  mismo  a  veces  los  ejercicios  se  han  alterado  un  poco  o  se 
presenta  solo  parte  de  ellos,  o  se  mezclan  versiones  de  ejercicios  de  distintos  anos  para  que 
no  sea  repet  it  ivo. 

Cl  1996,  1997,  2005  Responda  verdadero  o  falso  y  justifique  brevemente  (maximo  5 
lineas).  Una  respnesta  sin  justificacion  no  vale  nada  aunque  este  correcta,  una  respuesta 
incorrecta  puede  tener  algun  valor  por  la  justificacion. 

a )  Un  lenguaje  regular  tambien  es  LC,  y  adernas  determimstico. 

b )  Los  APs  determimstico s  no  son  mas  potentes  que  los  automatas  finitos.  Los  que 
son  mas  potentes  son  los  no  deterministicos. 

c)  Si  restringimos  el  tarnano  maximo  de  la  pila  de  los  automatas  de  pila  a  100,  estos 
aun  pueden  reconocer  ciertos  lenguajes  no  regulares,  como  {anbn,  n  <  100}. 

d)  Si  un  automata  de  pila  pudiera  tener  dos  pilas  en  vez  de  una  seria  mas  poderoso. 

e)  El  complcmento  de  un  lenguaje  LC  no  regular  tampoco  es  regular. 

/)  Si  L  es  LC,  LR  tambien  lo  es. 

g )  Lin  automata  de  pila  puede  determinar  si  un  programa  escrito  en  C  sera  aceptado 
por  el  compilador  (si  no  sabe  C  reemplacelo  por  Pascal,  Turing  o  Java). 

h)  Todo  subconjunto  de  un  lenguaje  LC  es  LC. 

i)  Los  prefijos  de  un  lenguaje  LC  forman  un  lenguaje  LC. 

Hemos  unido  ejercicios  similares  de  esos  anos. 

Cl  1996  En  la  siguiente  secuencia,  si  no  logra  hacer  un  item  puede  suponer  que  lo  ha 
resuelto  y  usar  cl  resultado  para  los  siguientes. 

a)  Intente  aplicar  cl  Teorema  de  Bornbeo  sin  la  restriccion  \uyv\  <  N  para  demostrar 
que  el  lenguaje  {ww,  w  E  {a,b}*}  no  es  LC.  ^Por  que  no  funciona? 

d)  ^En  que  falla  cl  Teorema  de  Bornbeo  si  quiere  aplicarlo  a  {wwR,  w  E  (a,  6}*}? 
^Es  posible  reforzar  cl  Teorema  para  probar  que  ese  conjunto  no  es  LC? 

Cl  1997  La  historia  de  los  movimientos  de  una  cuenta  corriente  se  puede  ver  como  una 
secuencia  de  depositos  y  extracciones,  donde  nunca  hay  saldo  negativo.  Considere  que 
cada  deposito  es  un  entero  entre  1  y  k  (fijo)  y  cada  extraccion  un  entero  entre  —k  y 
—  1.  Se  supone  que  la  cuenta  empieza  con  saldo  cero.  El  lenguaje  de  los  movimientos 
aceptables  es  entonces  un  subconjunto  de  {—k..k}*,  donde  nunca  cl  saldo  es  negativo. 
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a)  Dibuje  un  automata  de  pila  para  este  lenguaje.  En  beneficio  suyo  y  pensando  en 
la  parte  b),  hagalo  de  un  solo  estado.  Describalo  formalmente  como  una  tupla. 

b)  Transforme  el  automata  anterior  a  una  GLC  con  el  metodo  visto,  para  el  caso 
k  —  1.  /,Que  problema  se  le  presentaria  para  k  >  1?. 

c)  Modifique  el  automata  de  modo  que  pcrmita  un  sobregiro  de  n  unidades  pero  al 
final  el  saldo  no  pueda  ser  negativo. 

Ex  1997  Sea  M  =  (K,  E,  T,  A,  s,  F)  un  automata  de  pila.  Se  definio  que  el  lenguaje 
aceptado  por  M  es  £(M)  =  {w  e  E*,  (s,w,e)  \~*M  (/,  £,  e)}  (donde  /  e  F). 
Definimos  ahora  a  partir  de  M  otros  dos  lenguajes:  £i (M)  =  (w  G  E*,  ( s,w,e )  \~*M 
(/,  e,  a)}  (donde  /  G  F  y  a  e  T*),  y  £2(M)  =  {w  <E  E*,  (s,  w,  e)  \~*M  (, q ,  e,  e)}  (donde 
q  e  K). 

a)  Describa  en  palabras  lo  que  significan  C\  y  £2- 

b)  Demuestre  que  todo  automata  de  pila  M  se  puede  modificar  (obteniendo  un  M') 

de  modo  que  £(M')  =  C^M),  y  viceversa. 

c)  Lo  mismo  que  b)  para  £2. 

Cl  1998  Sea  P  un  pasillo  estrecho  sin  salida  disenado  para  ser  raptados  por  extraterrestres. 
La  gente  entra  al  pasillo,  permanece  un  cierto  tiempo,  y  finalmente  o  bien  es  raptada 
por  los  extraterrestres  o  bien  sale  (desilusionada)  por  donde  entro  (note  que  cl  ultimo 
que  entra  es  el  primero  que  sale,  si  es  que  sale).  En  cualquier  momento  pueden  entrar 
nuevas  personas  o  salir  otras,  pero  se  debe  respetar  cl  orden  impuesto  por  el  pasillo. 
Dada  una  cadena  formada  por  una  secuencia  de  entradas  y  salidas  de  personas,  se  desea 
determinar  si  es  correcta  o  no.  Las  entradas  se  indican  como  E  i,  es  decir  el  caracter  E 
que  indica  la  entrada  y  la  i  que  identifica  a  la  persona.  Las  salidas  se  indican  como  S  j. 
En  principio  i  y  j  deberian  ser  cadenas  de  caracteres,  pero  simplificaremos  y  diremos 
que  son  caracteres.  Por  ejemplo,  E1E2E3S2E4S1  es  correcta  (3  y  4  fueron  raptados), 
pero  EIE2E3S2EAS3  es  incorrecta  (pues  2  entro  antes  que  3  y  salio  antes). 

a)  Dibuje  un  automata  de  pila  que  reconozca  este  lenguaje. 

b)  De  una  GLC  que  genere  este  lenguaje. 

C2  1998  Lise  propiedades  de  clausura  para  demostrar  que  cl  siguiente  lenguaje  es  LC 
L  =  {1V1W2W3W4,  (vj:i  =  w2  V  w2  =  wf)  A  \wiW2W3w4\  par} 

Ex  1998,  Cl  2003  Use  el  Teorema  del  Bombeo  para  probar  que  los  siguientes  lenguajes 
no  son  LC: 


a)  L  =  {anbman,  m  <  n} 
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b)  L  =  {anbmcrds,  0  <  n  <  m  <  r,  0  <  s} 

C2  1999  Suponga  que  tiene  una  calculadora  logica  que  usa  notation  polaca  (tipo  HP).  Es 
decir,  primero  se  ingresan  los  dos  operandos  y  luego  la  operation.  Considerando  los 
valores  V  y  F  y  las  operaciones  +  (or),  *  (and)  y  —  (complements) ,  especifique  un 
automata  de  pila  que  reconoce  una  secuencia  valida  de  operaciones  y  queda  en  un 
estado  final  si  el  ultimo  valor  es  V. 

Por  ejemplo,  para  calcular  [A  orB )  and  C  y  los  valores  de  A,  B  y  C  son  V,  F  y  V, 
respectivamente;  usamos  la  secuencia  VF  +  V*. 

C2  1999  Escoja  una  de  las  dos  siguientes  preguntas: 

a)  Demuestre  que  el  lenguaje  L  =  {  dRABd? ,  i,j  >  0}  no  es  LC. 

b)  Si  L  es  LC  y  Res  regular  entonces  iL  —  Re s  LC?  /.Que  pasa  con  R  —  Ll  Justifique 
su  respuesta. 

Ex  1999  Escriba  una  GLC  G  que  genere  todas  las  posibles  GLC  sobre  el  alfabeto  {a,  b} 
y  que  usan  los  no  terminates  S,  A,  y  B.  Cada  posible  GLC  es  una  secuencia  de 
producciones  separadas  por  comas,  entre  parentesis  y  usando  el  simbolo  igual  para 
indicar  una  production.  Por  ejemplo,  una  palabra  generada  por  G  es  (S  =  ASB ,  A  = 
a,  B  —  b,S  —  e).  Indique  claramente  cuales  son  los  no  terminates  y  terminates  de  G. 

Cl  2000  (a)  Lin  automata  de  2  pilas  es  similar  a  un  automata  de  pila,  pero  puede  manejar 

dos  pilas  a  la  vez  (es  decir  poner  condiciones  sobre  ambas  pilas  y  modificarlas 
simultaneamente).  Muestre  que  con  un  automata  de  2  pilas  puede  reconocer  cl 
lenguaje  anbncn.  [Y  anbncndnl  }Y  anbncndnen7 

(b)  Se  tiene  una  GLC  G\  que  define  un  lenguaje  L i,  y  una  expresion  regular  E2 
que  define  un  lenguaje  L2.  /.Que  pasos  seguiria  para  generar  un  automata  que 
reconozca  las  cadenas  de  L\  que  no  se  puedan  expresar  como  una  cadena  w\w 2, 
donde  W\  y  w2  pertenecen  a  L21 

Cl  2001  Considere  un  proceso  donde  Pikachu  intenta  subir  los  pisos  de  un  edificio,  para 
lo  cual  recibe  la  energia  necesaria  en  una  cadena  de  entrada.  La  cadena  contiene  al 
comienzo  una  cierta  cantidad  de  letras  ,  tantas  como  pisos  tiene  el  edificio.  El  resto 
de  la  cadena  esta  formada  por  signos  “E”  y  ' ” .  Cada  snnbolo  E  en  la  entrada  lc  da 
a  Pikachu  una  unidad  de  energia,  y  cada  tres  unidades  de  energia  Pikachu  puede  subir 
un  piso  mas.  Por  otro  lado,  cada  ”  es  un  intervalo  de  tiempo  sin  recibir  energia.  Si 
pasan  cuatro  intervalos  de  tiempo  sin  recibir  energia,  Pikachu  pierde  una  unidad  E  de 
energia.  Si  se  recibe  una  E  antes  de  pasar  cuatro  intervalos  de  tiempo  de  ”s,  no  se 
pierde  nada  (es  decir,  los  ultimos  ”s  se  ignoran).  Si  recibe  cuatro  ”s  cuando  no 
tiene  nada  de  energia  almacenada,  Pikachu  muere. 
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Diseiie  un  automata  de  pila  que  acepte  las  cadenas  de  la  forma  xy  donde  x  =  In  e 
y  G  {E,  —  }*,  tal  que  y  lc  da  a  Pikachu  energia  suficiente  para  subir  un  edificio  de  n 
pisos  (puede  sobrar  energia). 

Ex  2002  Demuestre  que  para  toda  GLC  G,  existe  una  GLC  G'  en  forma  normal  de  Chomsky 
que  genera  el  mismo  lcnguaje. 

Cl  2004  Demuestre  que  si  L  es  LC,  entonces  las  cadenas  de  L  cuyo  largo  no  es  multiplo 
de  5  pero  si  de  3,  es  LC. 

Cl  2004  Se  tiene  la  siguiente  GLC:  E  — »  E  A  E  \  E  V  E  \  (E)  |  0  |  1. 

1.  Utilice  cl  metodo  basico  para  obtener  un  automata  de  pila  que  reconozca  C(E). 

2.  Repita  cl  procedimiento,  esta  vez  utilizando  el  metodo  visto  para  parsing  bottom- 
up. 

3.  Modihque  la  GLC  y/o  alguno  de  los  APs  para  obtener  un  automata  de  pila 
deterministico.  El  “A”  tiene  mayor  precedencia  que  cl  “V” . 

Cl  2005  Para  cada  uno  de  los  siguientes  lenguajes,  demuestre  que  o  bien  es  regular,  o  bien 
LC  y  no  regular,  o  bien  no  es  LC. 

1.  {anbm,  n  <  m  <  2 n} 

2.  {w  G  {a,  b}*,  w  tiene  cl  doblc  de  a’s  que  6’s  } 

3.  {apn+q,  n  >  0},  para  cualquier  p,  q  >  0. 

4.  {anbmSn+m\  m,  n  >  0}. 

Cl  2006  Demuestre  que  los  siguientes  lenguajes  son  libres  del  contexto. 

1.  L  —  {wwR,  w  G  L'},  donde  L'  es  un  lcnguaje  regular. 

2.  i  =  {fflG  {a,  b}*,  w  ^  wR}  ( wR  es  w  lcido  al  reves). 

Cl  2008  De  una  gramatica  libre  del  contexto  y  un  automata  de  pila  para  el  lenguaje  de 
cadenas  sobre  el  alfabeto  E  =  {+,—},  tal  que  cl  nurnero  de  — s  hasta  cualquier  posicion 
de  la  cadena  no  exceda  al  de  +s  en  mas  de  3  unidades. 

Cl  2008  Un  transductor  de  pila  (TP)  es  parecido  a  un  AP,  excepto  que  en  las  transiciones 
tambien  puede  escribir  caracteres  en  una  secuencia  de  salida.  Diremos  que  el  TP 
transforma  una  cadena  w  en  una  u  si  acepta  w  y  en  el  proceso  escribe  u  (al  ser  no 
deterministicos,  podria  transformar  w  en  varias  cosas  distintas).  Dchnimos  el  lenguaje 
generado  por  un  TP  como  el  conjunto  de  cadenas  que  puede  escribir  frente  a  cualquier 
entrada. 
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1.  Defina  formalmente  un  TP,  y  todo  lo  necesario  para  describir  formalmente  que 
transforma  w  en  u,  y  el  lenguaje  generado. 

2.  Demuestre  que  el  lenguaje  generado  por  un  TP  es  libre  del  contexto. 

3.12  Proyectos 

1.  Investigue  sobre  la  relation  entre  GLCs  y  las  DTDs  utilizadas  en  XML. 

2.  Investigue  mas  sobre  determinismo  y  parsing,  lenguajes  LL (k)  y  LR(k).  Hay  algo 
de  material  en  el  mismo  capftulo  indicado  del  libro,  pero  mucho  mas  en  un  libro  de 
compiladores,  como  [ASU86,  cap  4]  o  [AU72,  cap  5].  En  estos  libros  puede  encontrar 
material  sobre  otras  formas  de  parsing. 

3.  Investigue  sobre  herramientas  para  generar  parsers  automaticamente.  En  C/Unix  se 
Hainan  lex  y  yacc,  pero  existen  para  otros  sistemas  operativos  y  lenguajes.  Construya 
un  parser  de  algun  lenguaje  de  programacion  pequeno  y  luego  conviertalo  en  interprete. 

4.  Programe  cl  ciclo  de  conversion  GLC  — »  AP  — >  GLC. 

5.  Programe  la  conversion  a  Forma  Normal  de  Chomsky  y  cl  parser  de  tiempo  0(n3) 
asociado.  Esto  se  ve,  por  ejemplo,  en  [HMU01  sec  7.4], 
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Capitulo  4 


Maquinas  de  Turing  y  la  Tesis  de 
Church 

[LP81,  cap  4  y  5] 

La  computabilidad  se  puede  estudiar  usando  diversos  formalismos,  todos  cllos 
equivalentes.  En  este  curso  nos  hemos  decidido  por  las  Maquinas  de  Turing  por  dos  razones: 
(i)  se  parecen  a  los  automatas  de  distinto  tipo  que  venimos  viendo  de  antes,  (ii)  son  el 
modelo  canonico  para  estudiar  NP-completitud,  que  es  el  ultimo  capitulo  del  curso. 

En  este  capitulo  nos  centraremos  solamente  en  el  formalismo,  y  como  utilizarlo  y 
extenderlo  para  distintos  propositos,  y  en  cl  siguiente  lo  utilizaremos  para  obtener  los 
resultados  de  computabilidad.  Recomendamos  al  lector  el  uso  de  un  simulador  de 
MTs  (que  usa  la  notation  modular  descrita  en  la  Section  4.3)  que  permite  dibujarlas 
y  hacerlas  funcionar.  Se  llama  Java  Turing  Visual  (JTV)  y  esta  disponible  en 
http : //www. dec .uchile . cl/jtv.1 

Al  final  del  capitulo  intentaremos  convencer  al  lector  de  la  Tesis  de  Church,  que  dice 
que  las  Maquinas  de  Turing  son  equivalentes  a  cualquier  modelo  de  computation  factiblc  de 
constrain  Asimismo,  veremos  las  gramaticas  dependientes  del  contexto,  que  extienden  las 
GLCs,  para  completar  nuestro  esquema  de  reconocedores/generadores  de  lenguajes. 


4.1  La  Maquina  de  Turing  (MT)  [lpsi,  sec  4.1] 

La  Maquina  de  Turing  es  un  mecanismo  de  computation  notoriamente  primitivo,  y  sin 
embargo  (como  se  vera  mas  adelante)  permite  llevar  a  cabo  cualquier  computo  que  podamos 
hacer  en  nuestro  PC.  Informalmente,  una  MT  opera  con  un  cabezal  dispuesto  sobre  una  cinta 
que  tiene  comienzo  pero  no  tiene  fin,  extendiendose  hacia  la  derecha  tanto  como  se  quiera. 

1Esta  herramienta  se  desarrollo  en  el  DCC,  por  mi  alumno  Marco  Mora  Godoy,  en  su  Menroria  de 
Ingenieria.  Si  se  la  usa  debe  tenerse  en  cuenta  que  no  es  del  todo  estable,  y  a  veces  puede  borrar  los  archivos 
que  ha  grabado.  Funciona  mejor  con  jdk  1.4. 
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Cada  celda  de  la  cinta  almacena  un  caracter,  y  cuando  se  examina  un  caracter  de  la  cinta 
nunca  visto,  se  supone  que  este  contiene  un  bianco  (#).  Como  los  automatas,  la  MT  esta  en 
un  estado ,  de  un  conjunto  finito  de  posibilidades.  En  cada  paso,  la  MT  lee  cl  caracter  que 
tiene  bajo  el  cabezal  y,  segun  ese  caracter  y  cl  estado  en  que  esta,  pasa  a  un  nuevo  estado 
y  llcva  a  cabo  una  accion  sobre  la  cinta:  cambiar  el  caracter  que  lcyo  por  uno  nuevo  (en  la 
misma  celda  donde  tiene  el  cabezal),  o  mover  el  cabezal  hacia  la  izquierda  o  hacia  la  derecha. 

Como  puede  escribir  la  cinta,  la  MT  no  tendra  estados  finales  o  no  finales,  pues  puede 
dejar  escrita  la  respuesta  (si  o  no)  al  detenerse.  Existe  simplemente  un  estado  especial, 
denominado  h,  al  llegar  al  cual  la  computation  de  la  MT  se  detiene.  La  computation 
tarnbien  se  interrumpe  (sin  llegar  al  estado  h)  si  la  MT  trata  de  moverse  hacia  la  izquierda 
de  la  primera  celda  de  la  cinta.  En  tal  caso  decimos  que  la  MT  se  “cuclga” ,  pero  no  que  se 
detiene  o  que  la  computation  tormina. 

Tal  como  con  automatas,  dibujaremos  las  MTs  como  grafos  donde  los  nodos  son  los 
estados  y  las  transiciones  estan  rotuladas.  Una  transicion  de  p  a  q  rotulada  a,  b  significa  que 
si  la  MT  esta  en  el  estado  p  y  hay  una  letra  a  bajo  cl  cabezal,  entonces  pasa  al  estado  q  y 
realiza  la  accion  b.  La  accion  de  escribir  una  letra  a  €  E  se  denota  simplemente  a.  La  de 
moverse  a  la  izquierda  o  derecha  se  denota  <  y  D>,  respectivamente.  La  accion  de  escribir 
un  bianco  (fif)  se  llama  tarnbien  borrar  la  celda. 

Ejemplo  4.1  Dibujemos  una  MT  que,  una  vez  arrancada,  borre  todas  las  a’s  que  hay  desde  el 
cabezal  hacia  atras,  hasta  encontrar  otro  #.  El  alfabeto  es  {a,  jf}. 


Notar  que  si  se  arranca  esta  MT  con  una  cinta  que  tenga  puras  a’s  desde  el  comienzo  de  la 
cinta  hasta  el  cabezal,  la  maquina  se  colgara.  Notar  tarnbien  que  no  decimos  que  hacer  si  estamos 
en  el  estado  1  y  no  leemos  Formalmente  siempre  debemos  decir  que  hacer  en  cada  estado  ante 
cada  caracter  (como  con  un  AFD),  pero  nos  permitiremos  no  dibujar  los  casos  imposibles,  como 
el  que  hemos  omitido.  Finalmente,  vease  que  la  transicion  #,  #  es  una  forma  de  no  hacer  nada  al 
pasar  a  h. 

Definamos  formalmente  una  MT  y  su  operation. 

Definition  4.1  Una  Maquina  de  Turing  (MT)  es  una  tupla  AL  =  (K,H,6,s),  donde 
•  K  es  un  conjunto  finito  de  estados,  h  <jL  K . 
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•  E  es  un  alfabeto  finito,  |  6  E, 

•  s  G  K  es  el  estado  initial 

•  5  :  K  x  E  — >  ( K  U  {fi})  x  (ELI  {<,  >}),  <4,  >  ^  E,  es  la  funcion  de  transition. 

Ejemplo  4.2  La  MT  del  Ej.  4.1  se  escribe  formalmente  corno  M  =  (K,  E,<5,  s)  con  K  =  {0, 1} , 
£  =  {a,#},  s  =  0,  y 


5 

0 

1 

a 

1,# 

1  ,a 

# 

0,0 

Notar  que  hernos  debido  completar  de  alguna  forma  la  celda  <5(1,  a)  =  (l,a),  que  nunca  puede 
aplicarse  dada  la  forma  de  la  MT.  Vease  que,  en  un  caso  asi,  la  MT  funcionaria  eternamente  sin 
detenerse  (ni  colgarse). 

Definamos  ahora  lo  que  es  una  configuration.  La  information  que  necesitamos  para  poder 
completar  una  computation  de  una  MT  es:  su  estado  actual,  cl  contenido  de  la  cinta,  y  la 
position  del  cabezal.  Los  dos  ultimos  elcmentos  se  expresan  particionando  la  cinta  en  tres 
partes:  la  cadena  que  precede  al  cabezal  (e  si  estamos  al  inicio  de  la  cinta),  cl  caracter  sobre 
el  que  esta  el  cabezal,  y  la  cadena  a  la  derecha  del  cabezal.  Como  esta  es  infinita,  esta  cadena 
se  indica  solo  hasta  la  ultima  position  distinta  de  ff.  Se  fuerza  en  la  definition,  por  tanto,  a 
que  esta  cadena  no  pueda  terminar  en  ff. 

Definicion  4.2  Una  configuration  de  una  MT  Al  =  (K,  E,  S,  s)  es  un  elemento  de  Cm  = 
(K  U  {/r})  x  E*  x  E  x  (S*  —  (£*  o  {#})).  Una  configuracion  ( q,u,a,v )  se  escribira  tambien 
(q.uav),  e  incluso  simplemente  uav  cuando  el  estado  es  irrelevante.  Una  configuracion  de 
la  forma  ( h ,  u,  a,  v )  se  llama  configuracion  detenida. 

El  funcionamiento  de  la  MT  se  describe  mediante  como  nos  llcva  de  una  configuracion  a 
otra. 

Definicion  4.3  La  relacion  lleva  en  un  paso  para  una  MT  Al  =  (K ,  E,  5,  s),  La/C  Cm  x  Cm, 
se  define  como:  ( q,u,a,v )  \~m  (</,  u',  a',  v1)  si  q  G  K,  5(q,a)  =  (q',b),  y 

1.  Si  b  e  E  (la  accion  es  escribir  el  caracter  b  en  la  cinta),  entonces  v!  —  u,  v'  —  v, 
a'  =  b. 

2.  Si  b  =  <  (la  accion  es  moverse  a  la  izquierda),  entonces  u'a'  —  u  y  (i)  si  av  ff, 
entonces  v'  =  av,  de  otro  modo  v'  =  e. 

3.  Si  b  =  >  (la  accion  es  moverse  a  la  derecha),  entonces  v!  =  ua  y  (i)  siv^fie  entonces 
a'v'  =  v,  de  otro  modo  a'v'  =  ff. 
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Observacion  4.1  Notese  lo  que  ocurre  si  la  MT  quiere  moverse  hacia  la  izquierda  estando 
en  la  primera  celda  de  la  cinta:  la  ecuacion  via!  =  u  =  e  no  puede  satisfacerse  y  la 
configuracion  no  lleva  a  ninguna  otra,  pese  a  no  ser  una  configuracion  detenida.  Entonces 
la  computacion  no  avanza,  pero  no  ha  terminado  (esta  “ colgada ”). 

Como  siempre,  diremos  b  en  vez  de  \~m  cuando  M  sea  evidente,  y  b*  (b^-)  sera  la  clausura 
reflexiva  y  transitiva  de  b  (b m),  “lleva  en  cero  o  mas  pasos”. 

Definicion  4.4  Una  computacion  de  M  de  n  pasos  es  una  secuencia  de  configuraciones 
Co  \- M  Cl  \- M  ■  ■  ■  b M  Cn. 

Ejemplo  4.3  Mostremos  las  configuraciones  por  las  que  pasa  la  MT  del  Ej.  4.1  al  ser  arrancada 
desde  la  configuracion  fiaaag/. 

(0,  ffaaaa)  b  (1  ,ffaaaif)  b  (0 ,  #aaa)  b  (l,#aa#)  b  (0 ,  #aa) 
b  (l,#a#)  b  (0 ,#a)  b  (1,##)  b  (0,#)  b 

a  partir  de  la  cual  ya  no  habra  mas  pasos  porque  es  una  configuracion  detenida.  En  cambio,  si  la 
arrancamos  sobre  aaa  la  MT  se  colgara: 

(0,  aaa)  b  (1  ,aafe)  b  (0,  aa)  b  b  (0,a)  b  (I,  if1) 

y  de  aquf  ya  no  se  movera  a  otra  configuracion. 


4.2  Protocolos  para  Usar  MTs  [lpsi,  sec  4.2] 

Puede  verse  que  las  MTs  son  mecanismos  mucho  mas  versatiles  que  los  automatas  que 
hernos  visto  antes,  que  no  teman  otro  proposito  posible  que  leer  una  cadena  de  principio  a 
fin  y  terminar  o  no  en  un  estado  final  (con  pila  vacia  o  no).  Una  MT  transforma  el  contenido 
de  la  cinta,  por  lo  que  puede  utilizarse,  por  ejemplo,  para  calcular  funciones  de  cadenas  en 
cadenas. 

Definicion  4.5  Sea  f  :  Eq  — »  EJ,  donde  qL  E0  U  E^  Decimos  que  una  MT  M  = 
(K,  E,  S,  s)  compnta  /  si 

ES,  (s,#rn#)b^(/q#/H#). 

La  definicion  se  extiende  al  caso  de  funciones  de  multiples  argumentos,  /(uq,  w2, . . . ,  wjf), 
donde  la  MT  debe  operar  de  la  siguiente  forma: 


(s,  #uq#W2#  . . .  #wfc#)  h*M  (h,  #/(wr,  w2, . . . ,  wfc)#). 

Una  funcion  para  la  cual  existe  una  MT  que  la  computa  se  dice  Turing-computable  o 
simplemente  computable. 
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Esto  nos  inclica  cl  protocolo  con  el  cual  esperamos  usar  una  MT  para  calcular  funciones: 
cl  dominio  e  imagen  de  la  funcion  no  permiten  el  caracter  jf,  ya  que  este  se  usa  para  dclimitar 
el  argumento  y  la  respuesta.  El  cabezal  empieza  y  tcrmina  al  final  de  la  cadena,  dejando 
limpio  cl  resto  de  la  cinta. 

Observacion  4.2  Una  observation  muy  importante  sobre  la  Def.  4-5  es  que  M  no  se  cuelga 
frente  a  ninguna  entrada,  sino  que  siempre  llega  a  h.  Esto  significa  que  jamas  intenta 
moverse  hacia  la  izquierda  del  primer  #.  Por  lo  tanto,  si  sabemos  que  M  calcula  f ,  podemos 
con  confianza  aplicarla  sobre  una  cinta  de  la  forma  ffxffyffwff  V  saber  que  terminara  y 
dejara  la  cinta  en  la  forma  ffxffyfff{w)ff  sin  alterar  x  o  y. 

Ejemplo  4.4  Una  MT  que  calcula  f{w)  =  w  (es  decir,  cambiar  las  a’s  por  Us  y  viceversa  en 
w  €  {a,  b}*),  es  la  que  sigue: 

a,< I 


Notese  que  no  se  especifica  que  hacer  si,  al  ser  arrancada,  el  cabezal  esta  sobre  un  caracter 
distinto  de  ff,  ni  en  general  que  ocurre  si  la  cinta  no  sigue  el  protocolo  establecido,  pues  ello  no 
afecta  el  hecho  de  que  esta  MT  calcule  /  segrin  la  definicion. 

Ejemplo  4.5  Una  MT  que  calcula  f(w)  =  wwR  (donde  wR  es  w  escrita  al  reves),  es  la  que  sigue. 


Es  un  ejercicio  interesante  derivar  f(w)  =  ww  a  partir  de  este  ejemplo. 
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Es  posible  tambien  usar  este  formalismo  para  computar  funciones  de  numeros  naturales, 
mediante  representar  n  con  la  cadena  In  (lo  que  es  casi  notation  unaria). 

Definicion  4.6  Sea  f  :  N  — *  N.  Decimos  que  una  MT  M  computa  f  si  M  computa  ( segun 
la  Def.  j.5)  g  :  {/}*  — *  {/}*  dada  por  g(In)  =  I^n\  La  definicion  se  extiende  similarmente 
a  funciones  de  varias  variables  y  se  puede  hablar  de  funciones  Turing- computables  entre  los 
numeros  naturales. 

Ejemplo  4.6  Las  MTs  que  siguen  calculan  /(n)  =  n  +  1  (izquierda)  y  f(n,m)  =  n+m  (derecha). 


i,<  /,> 


Verifiquese  que  la  MT  de  la  suma  funciona  tambien  para  los  casos  f(n,  0)  (cinta  #/”##)  y 
/ (0,  m)  (cinta 


Hernos  visto  como  calcular  funciones  usando  MTs.  Volvamos  ahora  al  plan  original  de 
utilizarlas  para  reconocer  lenguajes.  Reconocer  un  lenguaje  es,  esencialmente,  responder  “si” 
o  “no”  frente  a  una  cadena,  dependiendo  que  este  o  no  en  el  lenguaje. 

Definicion  4.7  Una  MT  decide  un  lenguaje  L  si  calcula  la  funcion  fi  :  S*  — *  {S,  N}, 
definida  como  /^(w)  =  (y  si  no,  /^(w)  =  Nj.  Si  existe  tal  MT,  decimos  que  L  es 

Turing- decidible  o  simplemente  decidible. 

Notar  que  la  definicion  anterior  es  un  caso  particular  de  calcular  funciones  donde  So  =  E 
y  Ei  =  {S,  N}  (pero  /l  solo  retornara  cadenas  de  largo  1  de  ese  alfabeto). 

Existe  una  notion  mas  debil  que  la  de  decidir  un  lenguaje,  que  sera  esencial  en  cl 
proximo  capftulo.  Imaginemos  que  nos  piden  que  determi nemos  si  una  cierta  proposicion  es 
demostrable  a  partir  de  un  cierto  conjunto  de  axiomas.  Podemos  probar,  disciplinadamente, 
todas  las  demostraciones  de  largo  creciente.  Si  la  proposicion  es  demostrable,  algun  dfa 
daremos  con  su  demostracion,  pero  si  no...  nunca  lo  podremos  saber.  St,  podriamos 
tratar  de  demostrar  su  negacion  en  paralelo,  pero  en  todo  sistema  de  axiomas  suficientemente  potente 
existen  proposiciones  indemo strables  tanto  como  su  negacion ,  recordar  por  ejemplo  la  hipotesis  del  continuo 
(Obs.  1.3). 

Definicion  4.8  Una  MT  M  =  (K,  E,  5,  s )  acepta  un  lenguaje  L  si  se  detiene  exactamente 
frente  a  las  cadenas  de  L,  es  decir  (s,ffwff)  \~*M  ( h,uav )  w  G  L.  Si  existe  tal  MT, 

decimos  que  L  es  Turing-aceptable  o  simplemente  aceptable. 

Observacion  4.3  Es  facil  ver  que  todo  lenguaje  decidible  es  aceptable,  pero  la  inversa  no 
se  ve  tan  simple.  Esto  es  el  tema  central  del  proximo  capitulo. 
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4.3  Notacion  Modular  [lpsi,  sec  4.3  y  4.4] 

No  llegaremos  muy  lejos  si  insistimos  en  usar  la  notacion  aparatosa  de  MTs  vista  hasta 
ahora.  Necesitaremos  MTs  mncho  mas  potentes  para  enfrentar  el  proximo  capitulo  (y  para 
convencernos  de  qne  una  MT  es  equivalente  a  un  computador!).  En  esta  seccion  definiremos 
una  notacion  para  MTs  qne  permite  expresarlas  en  forma  mncho  mas  sucinta  y,  lo  que  es 
muy  importante,  poder  componer  MTs  para  formar  otras. 

En  la  notacion  modular  de  MTs  una  MT  se  vera  corno  un  grafo,  donde  los  nodos  seran 
acciones  y  las  aristas  condiciones.  En  cada  nodo  se  podra  escribir  una  secuencia  de  acciones, 
que  se  ejecutan  al  llegar  al  nodo.  Luego  de  ejecutarlas,  se  consideran  las  aristas  que  salen 
del  nodo.  Estas  son,  en  principio,  flechas  rotuladas  con  sfmbolos  de  E.  Si  la  flecha  que  sale 
del  nodo  esta  rotulada  con  la  lctra  que  coincide  con  la  que  tenemos  bajo  el  cabezal  luego  de 
ejecutar  el  nodo,  entonces  seguimos  la  flecha  y  llegamos  a  otro  nodo.  Nunca  debe  haber  mas 
de  una  flecha  aplicable  a  cada  nodo  (hasta  que  llcguemos  a  la  Seccion  4.5).  Permitiremos 
rotular  las  flechas  con  conjuntos  de  caracteres.  Habra  un  nodo  inicial,  donde  la  MT  comienza 
a  operar,  y  cuando  de  un  nodo  no  haya  otro  nodo  adonde  ir,  la  MT  se  detendra. 

Las  acciones  son  realmente  MTs.  Comenzaremos  con  2  +  |E|  acciones  basicas,  que 
corresponden  a  las  acciones  que  pueden  escribirse  en  5,  y  luego  podremos  usar  cualquier 
MT  que  dehnamos  como  accion  para  componer  otras. 

Definicion  4.9  Las  acciones  basicas  de  la  notacion  modular  de  MTs  son: 

•  Moverse  hacia  la  izquierda  (<):  Esta  es  una  MT  que,  pase  lo  que  pase,  se  mueve  hacia 
la  izquierda  una  casilla  y  se  detiene.  <\  =  ({s},  E,  5,  s),  donde  Vo  G  E,  <5(s,  a)  =  ( h ,  <l). 
(Notar  que  estamos  sobrecargando  el  simbolo  <\,  pero  no  deberia  haber  confusion.) 

•  Moverse  hacia  la  derecha  (>):  Esta  es  una  MT  que,  pase  lo  que  pase,  se  mueve  hacia 
la  derecha  una  casilla  y  se  detiene.  >  =  ({s},  E,  5,  s),  donde  Vo  G  E,  5(s,  a )  =  (h,  >). 

•  Escribir  el  simbolo  6  G  E  (b):  Esta  es  una  MT  que,  pase  lo  que  pase,  escribe  b  en  la 
cinta  y  se  detiene.  b  =  ({s},E,5,  s),  donde  Wa  G  E,  5(s,a)  =  (h,  b).  Nuevamente, 
estamos  sobrecargando  el  simbolo  b  G  E  para  denotar  una  MT. 


Observacion  4.4  Debenamos  definir  formalmente  este  mecanismo  y  demostrar  que  es 
equivalente  a  las  MTs.  No  lo  haremos  porque  es  bastante  evidente  que  lo  es,  su  definicion 
formal  es  aparatosa,  y  finalmente  podriamos  vivir  sin  este  formalismo,  cuyo  unico  objetivo 
es  simplificarnos  la  vida.  Se  puede  ver  en  el  libro  la  demostracion. 

Dos  MTs  sumamente  utiles  como  acciones  son  <U  y  que  se  mueven  hacia  la  izquierda 
o  derecha,  respectivamente,  hasta  encontrar  en  la  cinta  un  simbolo  de  A  C  E.  Otra  es  B , 
que  borra  la  cadena  que  tiene  hacia  la  izquierda  (hasta  el  bianco). 
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Definicion  4.10  Las  maquinas  <U,  >a  y  B  se  deftnen  segun  el  siguiente  diagrama: 


B  =  ><l 

La  maquina  <,4;  por  ejemplo,  comienza  moviendose  a  la  izquierda.  Luego,  si  cl  caracter 
sobre  cl  que  esta  parada  no  esta  en  A,  vuelve  a  moverse,  y  asi.  Si,  en  cierto  momento,  queda 
sobre  un  caracter  de  A,  entonces  luego  de  ejecutar  el  nodo  no  tiene  flecha  aplicablc  que 
seguir,  y  se  detiene. 

Notese  que  <U  y  primero  se  mueven,  y  luego  empiezan  a  verificar  la  condicion.  Es 
decir,  si  se  arrancan  paradas  sobre  una  letra  de  A,  no  la  veran.  Cuando  A  =  {a}  escribiremos 
■^a  y  ^ a  ■ 

Notese  tambien  la  forma  de  escribir  cualquier  conjunto  en  las  flechas.  Tambien  pudimos 
escribir  a  qL  A,  por  ejemplo.  Si  A  =  {a}  podrfamos  haber  escrito  a  a.  Cuando  les  demos 
nombre  a  los  caracteres  en  las  transiciones  utilizaremos  letras  griegas  para  no  confundirnos 
con  las  letras  de  la  cinta. 

El  dar  nombre  a  la  letra  que  esta  bajo  el  cabezal  se  usa  para  algo  mucho  mas  poderoso 
que  expresar  condiciones.  Nos  permitiremos  usar  ese  nombre  en  cl  nodo  destino  de  la  flecha. 
Ejemplificaremos  esto  en  la  siguiente  maquina. 

Definicion  4.11  La  maquina  shift  left  (S^)  se  define  de  segun  el  siguiente  diagrama  (parte 
izquierda). 


S<=  >  <  #  > - -  <1  o - -  >  >  <  # 


La  maquina  S<  comienza  buscando  cl  hacia  la  izcpiierda  (notese  que  hemos  ya  utilizado 
una  maquina  no  basica  como  accion).  Luego  se  mueve  hacia  la  derecha  una  celda.  La  flecha 
que  sale  de  este  nodo  se  puede  seguir  siempre,  pues  no  estamos  realmente  poniendo  una 
condicion  sino  llamando  a  a  la  letra  sobre  la  que  estamos  parados.  En  el  nodo  destino,  la 
MT  se  mueve  a  la  izquierda,  escribe  la  a  y,  si  no  esta  parada  sobre  el  #,  se  mueve  a  la 
derecha  y  vuelve  al  nodo  original.  Mas  precisamente,  vuelve  a  la  accion  de  moverse  a  la 
derecha  de  ese  nodo.  Notese  que  nos  permitimos  flechas  que  llegan  a  la  mitad  de  un  nodo,  y 
ejecutan  las  acciones  del  nodo  de  ahf  hacia  adelante.  Esto  no  es  raro  ya  que  un  nodo  de  tres 
acciones  ABC  se  puede  descomponer  en  tres  nodos  A  — >■  B  — >•  C.  Vale  la  pena  recalcar  que 
las  dos  ocurrencias  de  cr  en  cl  dibujo  indican  cosas  diferentes.  La  primcra  denota  una  letra 
de  la  cinta,  la  segunda  una  accion. 

No  existe  magia  en  utilizar  variables  en  esta  forma.  A  la  derecha  de  la  Def.  4.11  mostramos 
una  version  alternativa  sobre  el  alfabeto  E  =  {a,  b,  c,  )f\.  La  variable  realmente  actua  como 
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una  macro ,  y  no  afecta  el  modelo  de  MTs  porque  el  conjunto  de  valores  que  puede  tomar 
siempre  es  finito.  Es  interesante  que  este  mecanismo,  ademas,  nos  independiza  del  alfabeto, 
pues  la  definicion  de  S<  se  expandirla  en  maquinas  distintas  segun  E.  En  realidad,  lo  mismo 
ocurre  con  las  maquinas  basicas. 

La  maquina  S^,  entonces,  esta  pensada  para  ser  arrancada  en  una  configuration  tipo 
(s,  Xffwff)  (donde  w  no  contiene  blancos),  y  termina  en  la  configuration  ( h,Xw #).  Es 
decir,  toma  su  argumento  y  lo  mueve  una  casilla  a  la  izquierda.  Esto  no  cae  dentro  del 
formalismo  de  calcular  funciones,  pues  S<  puede  no  retornar  un  #  al  comienzo  de  la  cinta. 
Mas  bien  es  una  maquina  auxiliar  para  ser  usada  como  action.  La  forma  de  especificar  lo 
que  hacen  estas  maquinas  sera  indicar  de  que  configuration  de  la  cinta  llevan  a  que  otra 
configuration,  sin  indicar  el  estado.  Es  decir,  diremos  S<  :  #w#  — *  in#.  Nuevamente, 
como  S<  no  se  cuelga  haciendo  esto,  esta  claro  que  si  hubiera  una  X  antes  del  primer  bianco, 
esta  quedarfa  inalterada. 

Existe  una  maquina  similar  que  mueve  w  hacia  la  derecha.  Se  invita  al  lector  a  dibujarla. 
No  olvide  dejar  cl  cabezal  al  final  al  terminar. 

Definicion  4.12  La  maquina  “shift  right ”  opera  de  la  siguiente  forma.  St>  :  #tn#  — * 

#«■ 

Repetiremos  aliora  el  Ej.  4.5  para  mostrar  como  se  simplifica  dibujar  MTs  con  la  notation 
modular. 


Ejemplo  4.7  La  MT  del  Ej.  4.5  se  puede  dibujar  en  la  notation  modular  de  la  siguiente  forma. 
El  dibujo  no  solo  es  mucho  mas  simple  y  facil  de  entender,  sino  que  es  independiente  de  E. 


*  a  ^ 

<1 - -  #  a  <  #  a 


# 


Ejemplo  4.8  Otra  maquina  interesante  es  la  copiadora,  C  :  #u#  — >  #in#ic#.  Se  invita 
al  lector  a  dibujarla,  inspirandose  en  la  que  calcula  f(w)  =  wwR  del  Ej.  4.7.  Con  esta  maquina 
podemos  componer  facilmente  una  que  calcule  f(w )  =  ww:  C  5<.  Claro  que  esta  no  es  la  maquina 
mas  eficiente  para  calcular  /  (o  sea,  que  lo  logre  en  menos  pasos),  pero  hasta  el  Capitulo  6  la 
eficiencia  no  sera  un  tema  del  que  preocuparnos.  Ya  tendremos  bast-antes  problemas  con  lo  que  se  puede 
calcular  y  lo  que  no. 

Es  interesante  que  la  MT  que  suma  dos  numeros,  en  cl  Ej.  4.6,  ahora  puede  escribirse 
simplemente  como  S<.  La  que  incrementa  un  numero  es  I  >.  Con  la  notation  modular  nos 
podemos  atrever  a  implementar  operaciones  aritmeticas  mas  complejas. 
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Ejemplo  4.9  Una  MT  que  implementa  la  funcion  diferencia  entre  numeros  naturales  (dando  cero 
cuando  la  diferencia  es  negativa)  puede  ser  como  sigue. 


>  >#B 


La  MT  M  que  implementa  la  multiplication  puede  ser  como  sigue.  En  el  ciclo  principal  vamos 
construyendo  #In#Im#In'm  mediante  ir  reduciendo  In  e  ir  agregando  una  copia  de  Im  al  final 
de  la  cinta.  Cuando  In  desaparece,  pasamos  a  otro  ciclo  que  borra  Im  para  que  quede  solamente 


El  siguiente  ejemplo  es  importante  porque  demuestra  que  existen  lenguajes  decidibles 
que  no  son  lib  res  del  contexto. 

Ejemplo  4.10  La  siguiente  MT  decide  el  lenguaje  {anbncn,  n  >  0}. 


>N> 


Ejemplo  4.11  La  siguiente  maquina,  que  llamaremos  E.  recibe  entradas  de  la  forma  y 

se  detiene  sii  u  =  v.  La  usaremos  mas  adelante. 
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E  = 


< 

# 


o*  # 


#  < 


<  - 
o 


#  >  y 


< 


# 


Observation  4.5  El  uso  de  variables  para  denotar  nombres  de  letras  no  esta  exento  de 
problemas.  Imaginemos  que  haya  dos  formas  de  llegar  a  un  nodo,  una  de  ellas  asignando 
a  y  la  otra  no.  En  este  caso,  si  intentaramos  expandir  la  “macro”,  tendriamos  problemas. 
Simplemente  el  dibujo  no  representaria  una  MT.  Peor  aun:  una  flecha  rotulada  a  que  partiera 
de  ese  nodo  se  podria  interpretar  de  distinta  forma  segun  vengamos  de  un  nodo  donde  a  se 
asigne  ( en  cuyo  caso  la  flecha  esta  diciendo  que  la  letra  debe  ser  igual  al  valor  ya  fijado  de 
a),  o  de  otro  donde  no  (en  cuyo  caso  la  flecha  no  pone  una  condicion  sobre  la  letra  sino  que 
la  llama  a).  Este  tipo  de  ambigiiedades  debe  evitarse,  bajo  la  responsabilidad  de  quien  dibuja 
la  maquina.  Nuevamente  recordamos  que  este  mecanismo  no  es  parte  de  nuestro  formalismo 
real  sino  que  es  una  forma  abreviada  de  dibujar  las  MTs.  Es  nuestra  responsabilidad  usarlo 
correctamente. 


4.4  MTs  de  k  Cintas  y  Otras  Extensiones  [lpsi,  sec  4.5] 

Es  posible  extender  el  mecanismo  de  la  MT  sin  alterar  lo  que  se  puede  hacer  con  la  MT 
basica.  Esto  simplifica  mucho  dibujar  MTs  que  realicen  ciertas  tareas,  con  la  seguridad  de 
que  podriamos  hacerlo  con  MTs  basicas  de  ser  necesario.  Algunas  de  estas  extensiones  son: 
MTs  que  usan  varias  cintas,  MTs  con  varios  cabezales,  MTs  con  cinta  infinita  hacia  ambos 
lados,  MTs  con  cinta  fc- dimensional,  etc.  De  todos  esos  mecanismos,  cl  mas  util  es  la  MT 
con  k  cintas,  a  la  cual  nos  dedicaremos  en  esta  section.  Otras  extensiones  se  pueden  ver  en 
cl  libro. 

Una  MT  de  k  cintas  tiene  un  cabezal  en  cada  cinta.  En  cada  paso,  lee  simultaneamente 
los  k  caracteres  bajo  los  cabezales,  y  torna  una  decision  basada  en  la  /c-upla.  Esta  consiste 
de  pasar  a  un  nuevo  estado  y  realizar  una  action  en  cada  cinta. 

Definicion  4.13  Una  MT  de  k  cintas  es  una  tupla  M  =  (K,  E,  S,  S)  tal  que  K,  E  y  s  son 
como  en  la  Def.  f.l  y  S  :  K  x  Efc  — »  (K  U  {h})  x  (E  U  {<,  >})k . 

Definicion  4.14  Una  configuration  de  una  MT  de  k  cintas  M  =  (. K ,  E,  6,  s )  es  un  elemento 
de  CM  =  (K  U  {h})  x  (E*  x  E  x  (E*  —  (E*  o  {^})))fc.  Una  configuracion  se  escribira 
(q,  uiaiVi,u2a2V2,  •  •  • ,  ukOkVk ) . 

Definicion  4.15  La  relacion  llcva  en  un  paso  para  una  MT  de  k  cintas  M  = 
{K,E,6,s),  bM  C  Cm  x  Cm,  se  define  como:  (q,  u\a\V\,  1*202^2,  •••>  ukakvk)  b 
(<?',  u\a\v\1ii'2afy'2l . . . ,  u'ka'kv'k)  si  q  G  K,  5(q ,  ai,  a2i  ■  ■  ■ ,  ak)  =  (</,  61 , 62 ,  -  -  - ,  bk),  y  las  reglas 
de  la  Def.  f.3  se  cumplen  para  cada  UiOiVi,  uta'pv'i  y  6*. 
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Definamos  aliora  como  usaremos  una  MT  de  k  cintas. 

Definicion  4.16  Una  MT  de  k  cintas  arranca  con  una  configuracion  de  la  forma  ffwff  en 
la  cinta  1,  y  todas  las  otras  cintas  en  la  configuracion  fi.  Cuando  se  detiene,  la  configuracion 
de  la  cinta  1  es  la  salida,  mientras  que  los  contenidos  de  las  otras  cintas  se  ignoran. 

La  forma  en  que  usaremos  una  MT  de  k  cintas  en  la  notation  modular  es  algo  distinta. 
En  principio  parece  ser  menos  potente  pero  es  facil  ver  que  no  es  asf.  En  cada  action  y  cada 
condition,  pondremos  un  supramclice  de  la  forma  W  indicando  en  que  cinta  se  realiza  cada 
action  o  al  caracter  de  que  cinta  nos  referimos  en  cada  condition.  Se  puede  poner  condiciones 
sobre  distintas  cintas  a  la  vez,  como  . 

El  siguiente  ejemplo  muestra  como  se  simplifican  algunos  problcmas  si  se  pueden  utilizar 
varias  cintas.  La  MT  misrna  no  es  mucho  mas  chica,  pero  su  operatoria  es  mucho  mas  sencilla 
de  entender. 

Ejemplo  4.12  Una  MT  M  que  implementa  la  multiplication  (como  en  el  Ej.  4.9),  ahora  usando 
3  cintas,  puede  ser  como  sigue.  Ahora  In  e  Im  se  dejan  en  las  cintas  2  y  3,  respectivamente,  y  el 
resultado  se  construye  en  la  cinta  1. 


Vearnos  ahora  como  simular  una  MT  de  k  cintas  con  una  de  1  cinta,  para  convencernos 
de  que  podemos  usar  MTs  de  k  cintas  de  ahora  en  adelante  y  saber  que,  de  ser  necesario,  la 
podrfamos  convertir  a  una  traditional. 

La  forma  en  la  que  simularemos  una  MT  de  k  cintas  consiste  en  “particionar”  la  (unica) 
cinta  de  la  MT  simuladora  (que  es  una  MT  normal  de  una  cinta)  en  2k  “pistas” .  Cada  cinta 
de  la  MT  simulada  se  representara  con  2  pistas  en  la  cinta  simuladora.  En  la  primera  pista 
pondremos  cl  contenido  de  la  cinta,  y  en  la  segunda  marcaremos  la  position  del  cabezal: 
esa  pista  tendra  todos  0’s,  excepto  un  1  donde  esta  el  cabezal.  Formalmente,  esta  cinta 
particionada  se  expresa  teniendo  sfmbolos  de  (E  x  {0,  l})fc  en  cl  alfabeto.  Tambien  debemos 
tener  los  sfmbolos  originates  (E)  porque  la  simulation  empieza  y  termina  con  cl  contenido 
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de  la  cinta  1.  Y  tendremos  un  si'mbolo  adicional  $  ^  E  para  marcar  cl  comienzo  de  la  cinta 
simuladora. 

Por  ejemplo,  si  la  MT  simulada  tiene  las  cintas  en  la  configuration 


entonces  la  MT  simuladora  estara  en  la  siguiente  configuration 


$ 
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0 

0 

0 

# 

a 
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a 
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a 
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0 

0 

0 

0 

0 

1 

0 

0 

Notemos  qne  los  simbolos  grandes  son  el  $  y  el  #  verdadero.  Cada  columna  de  simbolos 
pequenos  es  en  realidad  un  unico  caracter  de  (S  x  {0,  l})fc.  El  cabezal  de  la  simuladora  estara 
sicmpre  al  final  de  la  cinta  particionada.  Para  simnlar  un  solo  paso  de  la  MT  simulada  en 
sn  estado  q ,  la  MT  simuladora  realizara  el  siguiente  procedimiento: 

1.  Buscara  cl  1  en  la  pista  2,  para  saber  donde  esta  cl  cabezal  de  la  cinta  1  simulada. 

2.  Leera  cl  simbolo  en  la  pista  1  y  lo  recordara.  ^Corno  lo  recordara?  Continnando  por 
una  MT  distinta  para  cada  simbolo  a  G  E  que  pneda  leer.  Llamemos  a  este  simbolo. 

3.  Buscara  cl  1  en  la  pista  4,  para  saber  donde  esta  cl  cabezal  de  la  cinta  2  simulada. 

4.  Leera  el  simbolo  en  la  pista  3  y  lo  recordara  en  Oo,. 

5.  Observara  el  valor  de  S(q,  <Ti, . . . ,  ak)  =  (</,  b\, . . . ,  bk).  ^Como?  Realmente  hay  una 
rutina  de  estas  para  cada  q  de  la  MT  simulada.  La  parte  de  lectura  de  los  caracteres 
es  igual  en  todas,  pero  ahora  difieren  en  que  hacen  frente  a  cada  tupla  de  caracteres. 
Asimismo,  para  cada  una  de  las  |E|fc  posibles  tuplas  leidas.  las  acciones  a  ejecutar  seran 
distintas. 

6.  Buscara  nuevamente  el  1  en  la  pista  2,  para  saber  donde  esta  el  cabezal  de  la  cinta  1 
simulada. 
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7.  Ejecutara  la  accion  correspondiente  a  la  cinta  1.  Si  es  <3  (>),  movera  cl  1  de  la  pista 
2  hacia  la  izquicrda  (derecha).  Si  es  escribir  6  6  S,  reemplazara  la  letra  de  la  pista  1 
por  b. 

8.  Buscara  nuevamente  el  1  en  la  pista  4,  para  saber  donde  esta  cl  cabezal  de  la  cinta  2 
simulada. 

9.  Ejecutara  la  accion  correspondiente  a  la  cinta  2. 


10.  Transferira  cl  control  al  modulo  que  Simula  un  paso  cuando  la  MT  simulada  esta  en  cl 
estado  q' . 


Mas  formalmente,  sea  M  =  (Jl ,  E,  6,  s )  la  MT  de  k  cintas  simulada.  Entonces  tendremos 
un  modulo  Fq  para  cada  q  G  K.  (Los  *  significan  cualquier  caracter,  es  una  forma  de  describir 
un  conjunto  finito  de  caracteres  de  (E  x  {0,  l})fc.) 


F<  = 


(Q|,  1. *,*,*,*) 


(*,1,*,*,*,*) 


(*,*,02, !,*»*) 


(*.*,*, l.V) 


>#< 


,<M) 


M) 


>mD, 


#  ,a2,a3 


Estos  modulos  Fq  terminan  en  modulos  de  la  forma  -Agjaiv..jafc  (notar  que,  una  vez 
expandidas  las  macros  en  el  dibujo  anterior,  hay  \T,\k  de  estos  modulos  D  al  final,  uno  para 
cada  posible  tupla  lcfda).  Lo  que  hace  exactamente  cada  modulo  D  depende  precisamente 
de  S(q,  ai, . . . ,  a*).  Por  ejemplo,  si  S(q,  a±,  a  2 ,  0,3)  =  ( q' ,  <3,  O,  6),  b  G  E,  entonces  Aq^ai^a2^a3  = 
1 1  D'2 l'l'ft.3  — >  Fq/.  Estas  acciones  individuales  mueven  cl  cabezal  hacia  la  izquierda  (/)  o 
derecha  (D)  en  la  pista  indicada,  o  escriben  b  (W). 


h 


(*,i,s 


(av0,a2,p2,a3,pi)  ,  ,  ,  ,  , 

(a,,0, o2,p1,o3,pi)  <  - ► 

$ 


<1 


n  _  (.ovPl,a2,l (o1>fl^2>0j(T3,ft) 

U2  -  /  < I  - -  «*!•  >  - -  (CTl’ft'CT2  d,C73,P,) 


(#,0,#,1,#,0)  > 


w  „  (ovPl,o2,p1,o3,l) 

Wb,3  -  >  <  (v>ViM) - -  (®1.  A.®2  .ft.  ^ 


Observar,  en  particular,  que  si  la  MT  simulada  se  cuclga  (intenta  moverse  al  $),  la 
simuladora  se  cuclga  tambien  (podriamos  haber  hecho  otra  cosa).  Si,  en  carnbio,  la  accion 
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Ai  se  para  sobre  un  significa  que  esta  tratando  de  acceder  una  parte  de  la  cinta  que  arin 
no  hemos  particionado,  por  lo  que  es  cl  momento  de  hacerlo. 

Hemos  ya  descrito  la  parte  mas  importante  de  la  simulacion.  Lo  que  nos  queda  es  mas 
sencillo:  debemos  particionar  la  cinta  antes  de  comenzar,  y  debemos  “des-particionar”  la 
cinta  luego  de  terminar.  Lo  primero  se  hace  al  comenzar  y  antes  de  transferir  el  control  a  Fs, 
mientras  que  lo  ultimo  se  hace  en  la  maquina  correspondiente  a  Fh  (que  es  especial,  distinta 
de  todas  las  otras  Fq,  q  G  K). 

Para  particionar  la  cinta,  simplemente  ejecutamos 


>  S><#<  $  >  (#,()#,  ^  (0,0#  ,0#  ,0) — I 

(#,i#  ,0#  ,0)> - -  Fs 

Finalmente,  sigue  la  maquina  des-particionadora  Fh.  No  es  complicada,  aunque  es  un 
poco  mas  enredada  de  lo  que  podria  ser  pues,  ademas  del  contenido,  queremos  asegurar  de 
dejar  cl  cabezal  de  la  MT  real  en  la  position  en  que  la  MT  simulada  lo  tenia  en  la  cinta  1. 


tO  0  *  *  *  *) 

<1$>  1  ’  *~<G> 

'  (0,1,*,*,*,*) 


t  (O  0  *  *  *  *) 

<l(o,i#,o#,o&>|>  ’  ’  ’  v  <a’> 

# 

^ 

V  ?  ?  5  5  / 


Lema  4.1  Sea  una  MT  de  k  cintas  tal  que,  arrancada  en  la  configuracion  (#w#, 
w  £  (S  —  {#})*,  (1)  se  detiene  en  la  configuracion  (q,  u\aiVi,  U2CI2V2,  ■  ■  ■ ,  Ukak^k),  (2)  se 
cuelga,  (3)  nunca  termina.  Entonces  se  puede  construir  una  MT  de  una  cinta  que,  arrancada 
en  la  configuracion  (1)  se  detiene  en  la  configuracion  Uiaiiq,  (2)  se  cuelga,  (3)  nunca 

termina. 

Prueba:  Basta  aplicar  la  simulacion  que  acabamos  de  ver  sobre  la  MT  de  k  cintas.  □ 
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4.5  MTs  no  Determimsticas  (MTNDs)  [lpsi,  sec  4.6] 

Una  extension  de  las  MTs  qne  resnltara  particularmente  importante  en  el  Capitulo  6, 
y  qne  ademas  nos  simplificara  la  vida  en  varias  ocasiones,  son  las  MT  no  determimsticas 
(MTNDs).  Estas  resultan  ser  equivalentes  a  las  MT  tradicionales  (determimsticas,  que 
ahora  tambien  llamaremos  MTD).  Una  MTND  puede,  estando  en  un  cierto  estado  y  viendo 
un  cierto  caracter  bajo  cl  cabezal,  tener  cero,  una,  o  mas  transiciones  aplicablcs,  y  puede 
elegir  cualquiera  de  ellas.  Si  no  tiene  transiciones  aplicables,  se  cuelga  (en  cl  sentido  de  que 
no  pasa  a  otra  configuration,  a  pesar  de  no  estar  en  la  configuration  detenida). 

En  la  notation  modular,  tendremos  cero  o  mas  flechas  aplicables  a  partir  de  un  cierto 
nodo.  Si  no  hay  flechas  aplicablcs,  la  MTND  se  detiene  (notar  la  diferencia  con  la  notation 
traditional  de  estados  y  transiciones).  Si  hay  al  rnenos  una  flecha  aplicable,  la  MTND  debe 
elegir  alguna,  no  puede  elegir  detenerse  si  puede  no  hacerlo.  Si  se  desea  explicitar  que  una 
alternativa  valida  es  detenerse,  debe  agregarse  una  flecha  hacia  un  nodo  que  no  haga  nada 
y  no  tenga  salidas. 

Definition  4.17  Una  Maquina  de  Turing  no  Determimstica  (MTND)  es  una  tupla  M  = 
(K ,  E,  A,  s),  donde  K,  E  y  s  son  como  en  la  Def.  4-1  V  A  C  (. K  x  E)  x  (( K  U  {h})  x  (E  U 
{<,»}))• 

Las  configuraciones  de  una  MTND  y  la  relation  b  son  identicas  a  las  de  las  MTDs.  Ahora, 
a  partir  de  una  cierta  configuration,  la  MTND  puede  llcvar  a  mas  de  una  configuration. 
Segun  esta  definition,  la  MTND  se  detiene  frente  a  una  cierta  entrada  sii  existe  una  secuencia 
de  elecciones  que  la  llevan  a  la  configuration  detenida,  es  decir,  si  tiene  forma  de  detenerse. 

Observation  4.6  No  es  conveniente  usar  MTNDs  para  calcular  funciones,  pues  pueden 
entregar  varias  respuestas  a  una  misma  entrada.  En  principio  las  utilizaremos  solamente 
para  aceptar  lenguajes,  es  decir,  para  ver  si  se  detienen  o  no  frente  a  una  cierta  entrada.  En 
varios  casos,  sin  embargo,  las  usaremos  como  submaquinas  y  nos  interesara  lo  que  puedan 
dejar  en  la  cinta. 

Las  MTNDs  son  sumamente  utiles  cuando  hay  que  resolver  un  problema  mediante  probar 
todas  las  alternativas  de  solution.  Permiten  reemplazar  cl  mecanismo  tedioso  de  ir  generando 
las  opciones  una  por  una,  sin  que  se  nos  escape  ninguna,  por  un  mecanismo  mucho  mas  simple 
de  “adivinar”  (generar  no  determinfsticamente)  una  unica  option  y  probarla. 

Ejemplo  4.13  Hagamos  una  MT  que  acepte  el  lenguaje  de  los  numeros  compuestos,  {In,  3p,  q  > 
2 ,n  =  p  ■  q}.  (Realmente  este  lenguaje  es  decidible,  pero  aceptarlo  ilustra  muy  bien  la  idea.)  Lo 
que  harfamos  con  una  MTD  (y  con  nuestro  lenguaje  de  programacion  favorito)  seria  generar,  uno 
a  uno,  todos  los  posibles  divisores  de  n,  desde  2  hasta  y/n,  y  probarlos.  Si  encontramos  un  divisor, 
n  es  compuesto,  sino  es  primo.  Pero  con  una  MTND  es  mucho  mas  sencillo.  La  siguiente  MTND 
genera,  no  determimsticamente,  una  cantidad  de  /’ s  mayor  o  igual  a  2. 
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G  =  >  >I>I—i 
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Ahora,  una  MTND  que  acepta  los  numeros  compuestos  es  GGME,  donde  G  es  la  MTND  de 
arriba,  M  es  la  multiplicadora  (Ej.  4.9)  y  E  es  la  MT  que  se  detiene  sii  recibe  dos  cadenas  iguales 
(Ej.  4.11). 

Es  bueno  detenerse  a  reflexionar  sobre  esta  MTND.  Primero  aplica  G  dos  veces,  con  lo  que 
la  cinta  queda  de  la  forma  para  algrin  par  p,  q  >  2.  A1  aplicar  M,  la  cinta  queda 

de  la  forma  #In#Ipq#.  A1  aplicar  E,  esta  se  detendra  solo  si  n  =  pq.  Esto  significa  que  la 
inmensa  mayoria  (infinitas!)  de  las  alternativas  que  produce  GG  llevan  a  correr  E  para  siempre  sin 
detenerse.  Sin  embargo,  si  n  es  compuesto,  existe  al  menos  una  election  que  llevara  E  a  detenerse 
y  la  MTND  aceptara  n. 


Ejemplo  4.14  Otro  ejemplo  util  es  usar  una  MTND  para  buscar  una  secuencia  dada  en  la  cinta, 
corno  abaa.  Una  MTD  debe  considerar  cada  posicion  de  comienzo  posible,  compararla  con  abaa,  y 
volver  a  la  siguiente  posicion  de  comienzo.  Esto  no  es  demasiado  complicado,  pero  mas  simple  es 
la  siguiente  MTND,  que  naturalmente  se  detiene  en  cada  ocurrencia  posible  de  abaa  en  w,  si  se  la 
arranca  en  #w. 


Los  ejemplos  anteriores  nos  llevan  a  preguntarnos  como  se  pueden  probar  todas  las 
alternativas  de  p  y  q,  si  son  infinitas.  Para  comprender  esto,  y  para  la  simulation  de  MTNDs 
con  MTDs,  es  conveniente  pensar  de  la  siguiente  forma.  Una  MTD  produce  una  secuencia 
de  configuraciones  a  lo  largo  del  tiempo.  Si  las  dibujamos  verticalmente,  tendremos  una 
linea.  Una  MTND  puede,  en  cada  paso,  generar  mas  de  una  configuration.  Si  las  dibujamos 
verticalmente,  con  cl  tiempo  fluyendo  hacia  abajo,  tenemos  un  arbol.  En  el  instante  t,  el 
conjunto  de  configuraciones  posibles  esta  indicado  por  todos  los  nodos  de  profundidad  t  en 
ese  arbol. 

Por  ejemplo,  aqiii  vemos  una  ejecucion  (deterministica)  de  la  MT  sumadora  (Ej.  4.6)  a 
la  izquierda,  y  una  ejecucion  (no  deterministica)  de  G  (Ej.  4.13)  a  la  derecha.  Se  ve  como  G 
puede  generar  cualquier  numero:  demora  mas  tiempo  en  generar  numeros  mas  largos,  pero 
todo  numero  puede  ser  generado  si  se  espera  lo  suficiente. 
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De  hecho  una  visualization  esquematica  de  la  ejecucion  de  GGME  (Ej.  4.13)  con  la 
entrada  J6  es  como  sigue. 
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Hemos  senalado  con  flechas  gruesas  los  unicos  casos  (2  x  3  y  3  x  2)  donde  la 
ejecucion  termina.  Nuevamente,  a  medida  que  va  pasando  mas  tiempo  se  van  prodnciendo 
combinaciones  mayores  de  p,  q. 

La  simulation  de  una  MTND  M  con  una  MTD  se  basa  en  la  idea  del  arbol.  Recorreremos 
todos  los  nodos  del  arbol  hasta  encontrar  uno  donde  la  MTND  se  detenga  (llegue  al  estado 
h),  o  lo  recorreremos  para  sicmpre  si  no  existe  tal  nodo.  De  este  modo  la  MTD  simuladora 
se  detendra  sii  la  MTND  simulada  se  detiene.  Como  se  trata  de  un  arbol  infinito,  hay  que 
recorrerlo  por  niveles  para  asegurarse  de  que,  si  existe  un  nodo  con  configuration  detenida, 
lo  encontraremos. 

Notese  que  la  aridad  de  este  arbol  es  a  lo  sumo  r  =  (\K\  +  1)  •  (|E|  +  2),  pues  ese  es  cl 
total  de  estados  y  acciones  distintos  que  pueden  derivarse  de  una  misma  configuration.  Por 
un  rato  supondremos  que  todos  los  nodos  del  arbol  tienen  aridad  r,  y  luego  resolveremos  cl 
caso  general. 

La  MTD  simuladora  usara  tres  cintas: 

1.  En  la  primera  cinta  mantendremos  la  configuration  actual  del  nodo  que  estamos 
simulando.  La  tendremos  precedida  por  una  marca  $,  necesaria  para  poder  limpiar 
la  cinta  al  probar  un  nuevo  nodo  del  arbol. 

2.  En  la  segunda  guardaremos  una  copia  de  la  entrada  intacta. 

3.  En  la  tercera  almacenaremos  una  secuencia  de  digitos  en  base  r  (o  sea  simbolos  sobre 

di,  d2,  ■  ■ .,  dr),  llamados  directivas.  Esta  secuencia  indica  cl  carnino  desde  la  raiz  hasta 
cl  nodo  actual.  Por  ejemplo  si  se  llega  al  nodo  bajando  por  el  tercer  hijo  de  la  raiz,  luego 
por  cl  primer  hijo  del  hijo,  y  luego  por  cl  segundo  hijo  del  nieto  de  la  raiz,  entonces 
cl  contenido  de  la  cinta  sera  El  nodo  raiz  corresponde  a  la  cadena  vacia. 

Cuando  estemos  simulando  el  fc-esimo  paso  para  llcgar  al  nodo  actual,  estaremos  sobre 
cl  fc-esimo  digito  en  la  secuencia. 

Lo  primero  que  hace  la  MTD  simuladora  es  copiar  la  cinta  1  en  la  2,  poner  la  marca 
initial  $  en  la  cinta  1,  y  borrarla.  Luego  entra  en  el  siguiente  ciclo  general: 

1.  Limpiara  la  cinta  1  y  copiara  la  cinta  2  en  la  cinta  1  (maquina  Prep). 

2.  Ejecutara  la  MTND  en  la  cinta  1,  siguiendo  los  pasos  indicados  en  las  directivas  de  la 
cinta  3  (maquina  M'). 

3.  Si  la  MTND  no  se  ha  detenido,  pasara  al  siguiente  nodo  de  la  cinta  3  (maquina  Inc )  y 
volvera  al  paso  1. 

Finalmente,  eliminara  el  $  de  la  cinta  1  y  se  asegurara  de  dejar  el  cabezal  donde  la  MTND 
simulada  lo  tenia  al  detenerse. 

La  MTD  simuladora  es  entonces  como  sigue.  El  ciclo  se  detiene  si,  luego  de  ejecutar  M' , 
en  la  cinta  de  las  directivas  no  estamos  parados  sobre  cl  #  final  que  sigue  a  las  directivas. 
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Esto  significa  que  M'  se  detuvo  antes  de  leerlas  todas.  0  sea,  M'  se  detuvo  porque  llego 
a  h  y  no  porque  se  le  acabaron  las  directivas.  En  realidad  pueden  haber  pasado  ambas  cosas  a  la 
vez,  en  cuyo  caso  no  nos  daremos  cuenta  de  que  M'  termino  justo  a  tiempo.  Pero  no  es  problema,  nos 
daremos  cuenta  cuando  tratemos  de  ejecutar  un  nodo  que  descienda  del  actual,  en  el  siguiente  nivel.  Para 
la  burocracia  final  necesitamos  otra  marca  Para  comprender  del  todo  como  funciona  esta 
burocracia  final  es  bueno  leer  primero  como  funciona  Prep  (especialmente  el  primer  punto, 
pues  aquf  se  hace  lo  misrno). 
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La  maquina  Prep  realiza  las  siguientes  acciones: 


1.  Se  mueve  hacia  la  derecha  en  la  cinta  1  todo  lo  necesario  para  asegurarse  de  estar  mas 
a  la  derecha  que  cualquier  cosa  escrita.  Como,  en  la  cinta  3,  hernos  pasado  por  una 
directriz  di  por  cada  paso  de  M  simulado,  y  M  no  puede  moverse  mas  de  una  casilla  a 
la  derecha  por  cada  paso,  y  la  simulation  de  M  comenzo  con  el  cabezal  al  final  de  su 
configuration,  basta  con  moverse  en  la  cinta  1  hacia  la  derecha  mientras  se  mueve  a  la 
izquierda  en  la  cinta  3,  hasta  llegar  al  primer  #  de  la  cinta  3.  Luego  vuelve  borrando 
en  la  cinta  1  hasta  el  $. 

2.  Se  mueve  una  casilla  hacia  adelante  en  la  cinta  3,  quedando  sobre  la  primera  directiva 
a  seguir  en  la  ejecucion  del  nodo  que  viene. 

3.  Copia  la  cinta  2  a  la  cinta  1,  quedando  en  la  configuration  initial 


4.5.  MTS  NO  DETER  5  UNIS  TIC  A  S  (MTNDS) 


95 


La  maquina  Inc  comienza  al  final  de  las  directivas  en  la  cinta  3  y  Simula  cl  calculo  del 
sucesor  en  un  numero  en  base  r:  Si  r  =  3,  el  sucesor  de  d\d\  es  d\d2,  luego  d3d3,  luego  d2d3, 
y  asi  hasta  d3d3,  cuyo  sucesor  es  didid3.  Por  ello  va  hacia  atras  convirtiendo  dr  en  d\  hasta 
que  encuentra  un  dt  ^  dr,  el  cual  cambia  por  di+3  (no  hay  suma  real  aquf,  hernos  abreviado 
para  no  poner  cada  i  separadamente) .  Si  llega  al  comienzo,  es  porque  eran  todos  dr,  y  es 
hora  de  pasar  al  siguiente  nivcl  del  arbol. 


Finalmente,  la  maquina  M'  es  la  MTD  que  realmente  Simula  la  MTND  M,  evitando  cl 
no  determinismo  mediante  las  directivas  de  la  cinta  3.  M'  tiene  los  mismos  estados  y  casi  las 
mismas  transiciones  que  M.  Cada  vez  que  M  tiene  r  salidas  desde  un  estado  por  un  cierto 
caracter  (izquierda),  M'  le  cambia  los  rotulos  a  esas  transiciones,  considerando  las  3  cintas 
en  las  que  act  ua  (derecha): 
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Notese  que  AL'  es  determim'stica,  pues  no  existen  dos  transiciones  que  salen  de  ningun 
q  por  las  mismas  letras  (ahora  tripletas).  Se  sabe  que  siempre  esta  sobre  en  la  cinta  2. 
Ahora  elige  pasar  al  estado  qt  ejecutando  la  action  bt  (en  la  cinta  1)  siempre  que  la  directiva 
actual  indique  dl .  En  la  cinta  3,  pasa  a  la  siguiente  directiva.  Ademas,  si  se  acabaron  las 
directivas,  se  detiene  para  dar  paso  a  la  simulation  del  siguiente  nodo  del  arbol.  Otro  detallc 
es  que,  si  la  MTND  se  cuelga,  lo  detectamos  porque  la  simuladora  queda  sobre  el  $  en  la 
cinta  1.  En  ese  caso  hacemos  como  si  la  MTND  hubiera  usado  todas  las  instrucciones  sin 
terminar,  de  modo  de  dar  lugar  a  otros  nodos  del  arbol. 

Si  en  cualquier  estado  q  frente  a  cualquier  caracter  a  hubiera  menos  de  r  alternativas 
distintas,  lo  mas  simple  es  crear  las  alternativas  restantes,  que  hagan  lo  mismo  que  algunas 
que  ya  existen.  Si  no  hubiera  ninguna  alternativa  la  MTND  se  colgaria,  por  lo  que  deberfamos 
agregar  una  rutina  similar  a  la  que  hicimos  para  el  caso  en  que  toque  $  en  la  cinta  1. 

Lema  4.2  Todo  lenguaje  aceptado  por  una  MTND  es  aceptado  por  una  MTD. 

Prueba:  Basta  producir  la  MTD  que  Simula  la  MTND  segun  lo  visto  recien  y  correrla  sobre  la 
misma  entrada.  (Esta  MTD  es  a  su  vez  una  MT  de  3  cintas  que  debe  ser  simulada  por  una  MT  de 
una  cinta,  segun  lo  visto  en  el  Lema  4.1.)  □ 

4.6  La  Maquina  Universal  de  Turing  (NLUT)  fLP8i,  sec  5.7] 

El  principio  fundamental  de  los  computadores  de  proposito  general  es  que  no  se  cablea 
un  computador  para  cada  problcma  que  se  desea  resolver,  sino  que  se  cablea  un  unico 
computador  capaz  de  interpretar  programas  escritos  en  algun  lenguaje.  Ese  lenguaje  tiene  su 
propio  modelo  de  funcionamiento  y  cl  computador  Simula  lo  que  haria  ese  programa  en  una 
cierta  entrada.  Tanto  cl  programa  como  la  entrada  conviven  en  la  memoria.  El  programa 
tiene  su  propio  alfabeto  (caracteres  ASCII,  por  ejemplo)  y  manipula  elementos  de  un  cierto 
tipo  de  datos  (incluyendo  por  ejemplo  numeros  enteros),  los  que  el  computador  codificae n  su 
propio  lenguaje  (bits),  en  el  cual  tambien  queda  expresada  la  salida  que  despues  el  usuario 
interpretara  en  terminos  de  los  tipos  de  datos  de  su  lenguaje  de  programacion.  El  computador 
debe  tener,  en  su  propio  cableado,  suficiente  poder  para  simular  cualquier  programa  escrito 
en  ese  lenguaje  de  programacion,  por  ejemplo  no  podria  simular  un  programa  en  Java  si  no 
tuviera  una  instruction  Goto  o  similar. 

Resultara  sumamente  util  para  cl  Capitulo  5  tener  un  modelo  similar  para  MTs.  En 
particular,  elegimos  las  MTs  como  nuestro  modelo  de  maquina  “cableada”  y  a  la  vez  como 
nuestro  modelo  de  lenguaje  de  programacion.  La  Maquina  Universal  de  Turing  (MUT) 
recibira  dos  entradas:  una  MT  M  y  una  entrada  w,  codiftcadas  de  alguna  forma,  y  simulara 
cl  funcionamiento  de  AL  sobre  w.  La  simulation  se  detendra,  se  colgara,  o  correra  para 
siempre  segun  AL  lo  haga  con  w.  En  caso  de  terminar,  dejara  en  la  cinta  la  codification  de 
lo  que  M  dejaria  en  la  cinta  frente  a  w. 

^Por  que  necesitamos  coclificar?  Si  varnos  a  representar  toda  MT  posible,  existen  MTs 
con  alfabeto  E  (finito)  de  tamano  n  para  todo  n ,  por  lo  cual  cl  alfabeto  de  nuestra  MT 
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deberia  ser  infinito.  El  mismo  problems  se  presents  en  un  computador  para  representar 
cualquier  niimero  natural,  por  ejemplo.  La  solution  es  similar:  codificar  cada  simbolo  del 
alfabeto  como  una  secuencia  de  simbolos  sobre  un  alfabeto  finito.  Lo  mismo  pass  con  la 
codification  de  los  estados  de  M. 

Para  poder  hacer  esta  codification  impondremos  una  condition  a  la  MT  M,  la  cual 
obviamente  no  es  restrictiva. 

Definition  4.18  Una  MT  M  =  (K,E,S,s)  es  codificable  si  K  =  {gx,  g2, . . . ,  q\K\}  V 
E  =  {#,  a2,  •  •  • ,  am}.  Definimos  tambien  =  {q1,  g2, . . .},  E^  =  {#,  a2, 
Consideraremos  a\  =  ff. 

Es  obvio  que  para  toda  MT  M'  existe  una  MT  M  codificable  similar,  en  cl  sentido  de  que 
lleva  de  la  misma  configuration  a  la  misma  configuration  una  vez  que  mapeamos  los  estados 
y  el  alfabeto. 

Definiremos  aliora  la  codification  que  usaremos  para  MTs  codificables.  Usaremos  una 
funcion  auxiliar  A  para  denotar  estados,  simbolos  y  acciones. 

Definition  4.19  La  funcion  A  :  U  {h}  U  U  {<,  >}  — »  I*  se  define  como  sigue: 


X 

\{x) 

h 

I 

qi 

P+1 

< 

I 

> 

II 

# 

III 

p+2 

Notese  que  A  puede  asignar  el  mismo  simbolo  a  un  estado  y  a  un  caracter,  pero  no 
daremos  lugar  a  confusion. 

Para  codificar  una  MT  esencialmente  codificaremos  su  estado  initial  y  todas  las  celdas 
de  5.  Una  celda  se  codificara  de  la  siguiente  forma. 

Definition  4.20  Sea  8(qi,af)  =  (</,  b)  una  entrada  de  una  MT  codificable.  Entonces 

Sij  =  c  A (qf)  c  A (a,j)  c  A (q')  c  A (b)  c 


Con  esto  ya  podemos  definir  como  se  codifican  MTs  y  cintas.  Notar  que  cl  nombre  de 
funcion  p  esta  sobrecargado. 
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Definicion  4.21  La  funcion  p  convierte  una  MT  codificable  M  =  (. K ,  E,  5,  s )  en  una 
secuencia  sobre  {c,  I}*,  de  la  siguiente  forma: 

p(M)  =  C  A(s)  C  ■  ■  ■  <Sl,|E|  $2,1  ■  ■  ■  <5*2, |E|  •  •  •  ‘S'lA'I,!  ^\K\,2  ■  ■  ■  <S'|K|,|E|  c 


Definicion  4.22  La  funcion  p  convierte  una  w  G  en  una  secuencia  sobre  {c,  I}*,  de  la 
siguiente  forma: 

p(w )  =  c  A('tci)  c  A (w2)  c  ...  c  A(w^|)  c 

Notar  que  p(e)  =  c. 

Finalmente,  estamos  en  condiciones  de  definir  la  MUT. 

Definicion  4.23  La  Maquina  Universal  de  Turing  (MUT),  arrancada  en  una  configuration 
(sMUT,ifp(M)p(w)jf),  donde  smut  es  su  estado  initial,  M  =  (Jl,  E,<5,  s)  es  una  MT 
codificable,  y  todo  Wi  G  E  —  {#},  hace  lo  siguiente: 

1.  Si,  arrancada  en  la  configuration  (s,ffwff),  M  se  detiene  en  una  configuration 
( h,uav ),  entonces  la  MUT  se  detiene  en  la  configuration  (h,#p(u)\(a)p(v)),  con  el 
cabezal  en  la  primera  c  de  p(v). 

2.  Si,  arrancada  en  la  configuration  (s,ff wff),  M  no  se  detiene  nunca,  la  MUT  no  se 
detiene  nunca. 

3.  Si,  arrancada  en  la  configuration  (s,ffwff),  M  se  cuelga,  la  MUT  se  cuelga. 

Vearnos  ahora  como  construir  la  MUT.  Haremos  una  construction  de  3  cintas,  ya  que 
sabemos  que  esta  se  puede  traducir  a  una  cinta: 

1.  En  la  cinta  1  tendremos  la  representation  de  la  cinta  simulada  (inicialmente  p{ffwff)) 
y  el  cabezal  estara  en  la  c  que  sigue  a  la  representation  del  caracter  donde  esta  cl 
cabezal  representado.  Inicialmente.  la  configuration  es  ffpififw) \[fif)c. 

2.  En  la  cinta  2  tendremos  siempre  ffp(M)ff  y  no  la  modificaremos. 

3.  En  la  cinta  3  tendremos  #A (<?)#,  donde  q  es  cl  estado  en  que  esta  la  maquina  simulada. 

El  primer  paso  de  la  simulation  es,  entonces,  pasar  de  la  configuration 
initial  (ffp(M)p(w)#,ff,ff),  a  la  apropiada  para  comenzar  la  simulation: 
(p(ffw)X(ff)c,ffp(M)ff,ff\(s)ff)  (A(s)  se  obtiene  del  comienzo  de  p(M)  y  en  realidad 
se  puede  eliminar  de  p(M)  al  moverlo  a  la  cinta  2).  Esto  no  conlleva  ninguna  dificultad. 
(Notese  que  se  puede  saber  donde  empieza  p[w)  porque  es  cl  unico  lugar  de  la  cinta  con  tres 
c’s  seguidas.) 

Luego  de  esto,  la  MUT  entra  en  un  ciclo  de  la  siguiente  forma: 
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1.  Verificamos  si  la  cinta  3  es  igual  a  pip,  en  cuyo  caso  se  detiene  (pues  /  =  A (h)  indica 
que  la  MT  simulada  se  ha  detenido).  Recordemos  que  en  una  simulation  de  k  cintas, 
la  cinta  1  es  la  que  se  entrega  al  terminar.  Esta  es  justamente  la  cinta  donde  tenemos 
codificada  la  cinta  que  dejo  la  MT  simulada. 

2.  Si  la  cinta  3  es  igual  a  pPp  Y  en  la  cinta  1  alrededor  del  cabezal  tenemos  . . .  cPc. . ., 
entonces  se  busca  en  la  cinta  2  el  patron  ccPcPc.  Notar  que  esta  entrada  debe  estar  si 
nos  dieron  una  representation  correcta  de  una  MT  y  una  w  con  el  alfabeto  adecuado. 

3.  Una  vez  que  encontramos  ese  patron,  examinamos  lo  que  lc  sigue.  Digamos  que  es  de 
la  forma  Irclsc.  Entonces  reescribimos  la  cinta  3  para  que  diga  pPp,  y: 

(a)  Si  s  —  1  debemos  movernos  a  la  izquierda  en  la  cinta  simulada.  Ejecutamos 

Si  la  c  sobre  la  que  quedamos  no  esta  precedida  de  un  bianco  p,  tcrminamos 
ese  paso.  Si  si,  la  MT  simulada  se  ha  colgado  y  debemos  colgarnos  tambien 
(<(b  desde  ese  P),  aunque  podriamos  hacer  otra  cosa.  En  cualquier  caso,  al 
movernos  debemos  asegurarnos  de  no  dejar  X(p)c  al  final  de  la  cinta,  por  la  regia 
de  que  las  conhguraeiones  no  deberian  terminar  en  p.  Asi,  antes  de  movernos 
a  la  izquierda  debemos  verihcar  que  la  cinta  que  nos  rodea  no  es  de  la  forma 
. . .  c\[pf)cp  ...  =  ...  cl  IIcp  ....  Si  lo  es,  debemos  borrar  el  A  (p)c  final  antes 
que  nada. 

(b)  Si  s  =  2,  debemos  movernos  a  la  derecha  en  la  cinta  simulada.  Ejecutamos 

Si  quedamos  sobre  una  c,  tcrminamos  de  simular  este  paso.  Si  quedamos  sobre  un 
bianco  P,  la  MT  simulada  se  ha  rnovido  a  la  derecha  a  una  celda  nunca  explorada. 
En  este  caso,  escribimos  A (#)c  =  IIIc  a  partir  del  p  y  quedamos  parados  sobre 
la  c  final. 

(c)  Si  s  >  2,  debemos  modihear  el  shnbolo  bajo  cl  cabezal  de  la  cinta  simulada. 

Es  decir,  el  entorno  alrededor  del  cabezal  en  la  cinta  1  es  . .  .cPc. . .  y  debemos 
convertirlo  en  ...  clsc. . ..  Esto  no  es  dificil  pero  es  un  poco  trabajoso,  ya  que 
involucra  hacer  o  eliminar  espacio  para  el  nuevo  shnbolo,  que  tiene  otro  largo. 
No  es  dificil  crear  un  espacio  con  la  secuencia  de  acciones  P  c  <1  />,  o 

borrarlo  con  la  secuencia  <p  >  P  S<  c. 

4.  Volvemos  al  paso  1. 

La  descripcion  demuestra  que  la  MUT  realmente  no  es  excesivamente  compleja.  De 
hecho,  escribirla  explicitamente  es  un  buen  ejercicio  para  demostrar  maestria  en  el  manejo 
de  MTs,  y  simularla  en  .JTV  puede  ser  entretenido. 
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4.7  La  Tesis  de  Church  [lpsi,  sec  5.1} 

A1  principio  de  este  capi'tulo  se  explicaron  las  razones  para  preferir  las  MTs  como 
mecanismo  para  estudiar  computabilidad.  Es  hora  de  dar  soporte  a  la  correctitud  de  esta 
decision. 

^Que  deberia  significar  que  algo  es  o  no  “computable”,  para  que  lo  que  podamos 
demostrar  sobre  computabilidad  sea  relevante  para  nosotros?  Quisieramos  que  la  definition 
capture  los  procedimientos  que  pueden  ser  realizados  en  forma  mecanica  y  sistematica,  con 
una  cantidad  finita  (pero  ilimitada)  de  recursos  (tiempo,  memoria). 

^Que  tipo  de  objetos  quisieramos  manejar?  Esta  claro  que  cadenas  sobre  alfabetos  finitos 
o  numerables,  o  numeros  enteros  o  racionales  son  realistas,  porque  existe  una  representation 
finita  para  cllos.  No  estaria  tan  bien  cl  pcrmitirnos  representar  cualquier  numero  real, 
pues  no  tienen  una  representation  finita  (no  alcanzan  las  secuencias  finitas  de  simbolos 
en  ningiin  alfabeto  para  representar  los,  recordar  el  Teo.  1.2).  Si  los  conjuntos  de  cardinal 

se  permitieran,  podriamos  tambien  pcrmitir  programas  infinitos,  que  podrian  reconocer 
cualquier  lenguaje  o  resolver  cualquier  problema  mediante  un  codigo  que  considerara  las 
infinitas  entradas  posibles  una  a  una: 

if  w  =  abbab  then  return  S 

if  w  =  bbabbabbbabbabbbb  then  return  S 

if  w  =  bb  then  return  N 

if  w  =  bbabbbaba  then  return  S 


lo  cual  no  es  ni  interesante  ni  realista,  al  menos  con  la  tecnologia  conocida. 

^Que  tipo  de  acciones  quisieramos  pcrmitir  sobre  los  datos?  Esta  claro  quo  los  automatas 
finitos  o  de  pila  son  mecanismos  insatisfactorios,  pues  no  pueden  reconocer  lcnguajes  que 
se  pueden  reconocer  facilmente  en  nuestro  PC.  Las  MTs  nos  han  permitido  resolver  todo  lo 
que  se  nos  ha  ocurrido  hast  a  ahora,  pero  pronto  veremos  cosas  que  no  se  pueden  hacer. 
Por  lo  tanto,  es  valido  preguntarse  si  un  lirnite  de  las  MTs  debe  tomarse  en  serio,  o 
mas  generalmente,  cual  es  un  modelo  valido  de  computation  en  cl  mundo  real.  Esta  es 
una  pregunta  dificil  de  responder  sin  sesgarnos  a  lo  que  conocemos.  ^Seran  aceptables 
la  computation  cuantica  (i se  podra  finalmente  implementar  de  verdad?),  la  computation 
biologica  (al  menos  ocurre  en  la  realidad),  la  computation  con  cristales  (se  ha  dicho  que  la 
forma  de  cristalizarse  de  algunas  estructuras  al  pasar  al  estado  solido  resuclve  problemas 
considerados  no  computables)?  /,No  se  descubrira  manana  un  mecanismo  hoy  impensable 
de  computacion? 

La  discusion  deberia  convencer  al  lector  de  que  el  tenia  es  debatible  y  ademas  que  no  se 
puede  demostrar  algo,  pues  estamos  hablando  del  mundo  real  y  no  de  objetos  abstractos. 
Nos  deberemos  contentar  con  un  modelo  que  nos  parezca  razonable  y  convincente  de  que  es 
lo  computable.  En  este  sentido,  es  muy  afortunado  que  los  distintos  modelos  de  computacion 
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que  se  han  usado  para  expresar  lo  que  todos  entienden  por  computable,  se  han  demostrado 
equivalentes  entre  si.  Algunos  son: 

1.  Maquinas  de  Turing. 

2.  Maquinas  de  Acceso  Aleatorio  (RAM). 

3.  Funciones  recursivas. 

4.  Lenguajes  de  programacion  (teoricos  y  reales). 

5.  Calculo  A. 

6.  Gramaticas  y  sistemas  de  reescritura. 

Esta  saludable  coincidencia  es  la  que  le  da  fuerza  a  la  llamada  Tests  de  Church. 

Definicion  4.24  La  Tesis  de  Church  establece  que  las  funciones  y  problemas  computables 
son  precisamente  los  que  pueden  resolverse  con  una  Maquina  de  Turing. 

Una  buena  forma  de  convencer  a  alguien  con  formation  en  computation  es  mostrar  que 
las  MTs  son  equivalentes  a  las  maquinas  RAM,  pues  estas  ultimas  son  una  abstraction  de 
los  computadores  que  usarnos  todos  los  dfas.  Existen  muchos  modelos  de  maquinas  RAM. 
Describimos  lino  simple  a  continuation. 

Definicion  4.25  Un  modelo  de  maqina  RAM  es  como  sigue:  existe  una  memoria  formada 
por  celdas,  cada  una  almacenando  un  numero  natural  mi  e  indexada  por  un  numero  natural 
i  >  0.  Un  programa  es  una  secuencia  de  instrucciones  Li}  numeradas  en  lineas  l  >  1.  La 
instruccion  en  cada  Unea  puede  ser: 

1.  Set  i,  a,  que  asigna  mi  <—  a,  donde  a  es  constante. 

2.  Mov  i,  j ,  que  asigna  nii  <—  irij. 

3.  Sum  i,  j ,  que  asigna  mi  <—  mi  +  rrq . 

4-  Sub  i,  j,  que  asigna  mt  <—  max(0,  m*  —  mj ). 

5.  IfZ  i,  l,  que  si  mj  =  0  transfiere  el  control  a  la  Unea  Li,  donde  l  es  una  constante. 

En  todas  las  instrucciones,  i  (lo  mismo  j)  puede  ser  un  simple  numero  (representando 
una  celda  fija  mi),  o  tambien  de  la  forma  *i,  para  una  constante  i,  donde  i  es  ahora  la 
direction  de  la  celda  que  nos  interesa  (mmJ. 

El  control  comienza  en  la  Unea  y  luego  de  ejecutar  la  Lt  pasa  a  la  Unea  Li+1,  salvo 
posiblemente  en  el  caso  de  IfZ.  La  entrada  y  la  salida  quedan  en  la  memoria  en  posiciones 

convenidas.  Una  celda  no  accesada  contiene  el  valor  cero.  La  ejecucion  termina  luego  de 

ejecutar  la  ultima  Unea. 
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No  es  diffcil  convencerse  de  que  cl  modelo  de  maquina  RAM  que  hemos  definido  es  tan 
potente  como  cualquier  lenguaje  Ensamblador  (Assembler)  de  una  arquitectura  (al  cual  a 
su  vez  se  traducen  los  programas  escritos  en  cualquier  lenguaje  de  programacion) .  De  hecho 
podriamos  haber  usado  un  lenguaje  aun  mas  primitivo,  sin  Set,  Sum  y  Sub  sino  solo  Inc  to*,  que  incrementa 
to*.  Tampoco  es  diffcil  ver  que  una  maquina  RAM  puede  simular  una  MT  (jel  JTV  es  un 
buen  ejemplo!).  Veamos  que  tambien  puede  hacerse  al  reves. 

Una  MT  de  2  cintas  que  Simula  nuestra  maquina  RAM  almacenara  las  celdas  que  han 
sido  inicializadas  en  la  cinta  1  de  la  siguiente  forma:  si  rnt  =  a  almacenara  en  la  cinta  1  una 
cadena  de  la  forma  cll+1cla+1c.  La  cinta  estara  compuesta  de  todas  las  celdas  asignadas,  con 
esta  representation  concatenada,  y  todo  precedido  por  una  c  (para  que  toda  celda  comicnce 
con  cc).  Cada  lfnea  Li  tendra  una  pequena  MT  Mi  que  la  Simula.  Luego  de  todas  las  lfneas, 
hay  una  Mi  extra  que  simplemente  se  detiene. 

1.  Si  Li  dice  Set  i,  a,  la  Mi  buscara  ccP+1c  en  la  cinta  1.  Si  no  la  encuentra  agregara 
ccP+1cIc  al  final  de  la  cinta  (inicializando  asf  rnt  •<—  0).  Ahora,  modificara  lo  que  sigue 
a  ccP+1c  para  que  sea  Ia+1c  (hacicndo  espacio  de  ser  necesario)  y  pasara  a  Mi+\.  Si  la 
instruction  dijera  Set  *i,  a,  entonces  se  averigua  (e  inicializa  de  ser  necesario)  el  valor 
de  rnt  solo  para  copiar  Imi  a  una  cinta  2.  Luego  debe  buscarse  la  celda  que  empieza 
con  cclmic  en  la  cinta  1,  y  recien  reemplazar  lo  que  sigue  por  Ia+1c.  En  los  siguientes 
items  las  inicializaciones  seran  implicitas  para  toda  celda  que  no  se  encuentre,  y  no  se 
volveran  a  mencionar. 

2.  Si  Li  dice  Mov  i,  j,  la  Mi  buscara  ccP+1c  en  la  cinta  1  y  copiara  los  P s  que  le  siguen 
en  la  cinta  2.  Luego,  buscara  ccP+1c  en  la  cinta  1  y  modificara  los  P s  que  siguen  para 
que  sean  iguales  al  contenido  de  la  cinta  2.  Luego  pasara  a  Mi+\.  Las  adaptaciones 
para  los  casos  «  y/o  *j  son  similares  a  los  de  Set  y  no  se  volveran  a  mencionar  (se 
puede  llegar  a  usar  la  tercera  cinta  en  este  caso,  por  comodidad). 

3.  Si  Li  dice  Sum  i,  j,  la  Mt  buscara  ccP+1c  en  la  cinta  1  y  copiara  los  P s  que  le  siguen 
en  la  cinta  2.  Luego,  buscara  ccP+1c  en  la  cinta  1  y,  a  los  P s  que  le  siguen,  les  agregara 
los  de  la  cinta  2  menos  uno. 

4.  Si  Li  dice  Sub  i,  j,  la  Mi  buscara  ccP+1c  en  la  cinta  1  y  copiara  los  P s  que  le  siguen  en 
la  cinta  2.  Luego,  buscara  ccll+1c  en  la  cinta  1  y,  a  los  P s  que  le  siguen,  les  quitara  la 
cantidad  que  haya  en  la  cinta  2  (dejando  solo  un  I  si  son  la  misma  cantidad  o  menos). 

5.  Si  Li  dice  IfZ  i ,  l',  la  Mi  buscara  ccP+1c  en  la  cinta  1.  Luego  vera  que  sigue  a  ccll+1c. 
Si  es  Jc,  pasara  a  la  My,  sino  a  la  Mi+1. 

No  es  diffcil  ver  que  la  simulation  es  correcta  y  que  no  hay  nada  del  modelo  RAM 
que  una  MT  no  pueda  hacer.  Asimismo  es  facil  ver  que  se  puede  calcular  lo  que  uno 
quiera  calcular  en  un  PC  usando  este  modelo  RAM  (restringido  a  los  naturales,  pero  estos 
bastan  para  representar  otras  cosas  como  enteros,  rationales,  e  incluso  strings  si  se  numeran 
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adecuadamente).  Si  el  lector  esta  pensando  en  los  reales,  debe  recordar  que  en  un  PC  no  se  puede 
almacenar  cualquier  real,  sino  solo  algunos  racionales. 

Lema  4.3  Los  modelos  de  la  MT  y  la  maquina  RAM  son  computacionalmente  equivalentes. 
Prueba:  La  simulation  y  discusion  anterior  lo  prueban.  □ 

En  lo  que  resta,  en  virtud  de  la  Tesis  de  Church,  raramente  volveremos  a  prefijar  las 
palabras  “decidiblc”  y  “aceptable”  con  “Turing-”,  aunque  algunas  veces  valdra  la  pena 
enfatizar  el  modelo  de  MT. 


4.8  Gramaticas  Dependientes  del  Contexto  (GDC) 

[LP81,  sec  5.2] 

Otro  modelo  de  computation  equivalente  a  MTs  es  cl  de  las  gramaticas  dependientes 
del  contexto,  tambien  llamadas  “sistemas  de  reescritura” .  Las  estudiaremos  en  esta  section 
porque  completan  de  modo  natural  la  dicotonua  que  venimos  haciendo  entre  mecanismos 
para  generar  versus  reconocer  lenguajes. 

Definition  4.26  Una  gramatica  dependiente  del  contexto  (GDC)  es  una  tupla  G  = 
(V,  E,  R,  S),  donde 

1.  V  es  un  conjunto  finito  de  simbolos  no  terminates. 

2.  E  es  un  conjunto  finito  de  simbolos  terminates,  V  D  E  =  0. 

3.  S  €  V  es  el  simbolo  initial. 

4-  R  Cf  (( V  U  E)+  —  E*)  x(bU  E)*  son  las  reglas  de  derivation  (conjunto  finito). 
Escribiremos  las  reglas  de  R  como  x  — >g  z  0  simplemente  x  — *  z  en  vez  de  (x,  z ). 

Se  ve  que  las  GDCs  se  parecen  bastante,  en  principio,  a  las  GLCs  del  Capitulo  3,  con  la 
diferencia  de  que  se  transforman  subcadenas  complctas  (dentro  de  una  mayor)  en  otras,  no 
solo  un  unico  simbolo  no  terminal.  Lo  unico  que  se  pide  es  que  haya  algun  no  terminal  en 
la  cadena  a  reemplazar.  Ahora  definiremos  formalmente  el  lcnguaje  descrito  por  una  GDC. 

Definition  4.27  Dada  una  GDC  G  =  (V,  E ,R,S),  la  relacion  lleva  en  un  paso  =^g(~4 
(V  U  E)*  x  (DU  E)*  se  define  como 

Vu,v,  \/x  — »  Z  G  R,  UXV  ==^G  uzv ■ 
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Definicion  4.28  Deftnimos  la  relacion  lleva  en  cero  o  mas  pasos,  como  la  clausura 

reflexiva  y  transitiva  de 

Escribiremos  simplemente  ==>-  y  =^*  cuando  G  sea  evidente. 

Notamos  que  se  puede  llevar  en  cero  o  mas  pasos  a  una  secuencia  que  aun  contiene  no 
terminales.  Cuando  la  secuencia  tiene  solo  terminales,  ya  no  se  puede  transformar  mas. 

Definicion  4.29  Dada  una  GDC  G  =  (V,  £ ,R,S),  definimos  el  lenguaje  generado  porG, 
C(G),  como 

C{G)  =  {w  €  £*,  S  ==>q  w}. 


Finalmente  definimos  los  lenguajes  dependientes  del  contexto  como  los  expresables  con 
una  GDC. 

Definicion  4.30  Un  lenquaje  L  es  dependiente  del  contexto  (DC)  si  existe  una  GDC  G  tal 
que  L  =  C(G). 


Un  par  de  ejemplos  ilustraran  el  tipo  de  cosas  que  se  pueden  hacer  con  GDCs.  El  primero 
genera  un  lenguaje  que  no  es  LC. 

Ejemplo  4.15  Una  GDC  que  genere  el  lenguaje  {tc  €  {a,  b,  c}*,  w  tiene  la  misma  cant.idad  de 
a’s,  b's,  y  c’s  }  puede  ser  V  =  {5,  A,  B,  C}  y  R  con  las  reglas: 

S  — >  ABCS  AB  — y  BA  AC  — y  CA  BC  —yCB  A  — *  a 

S  — >  e  BA  — »  AB  CA  — >  AC  CB  — y  BC  B  — y  b 

C  ^  c 

A  partir  de  S  se  genera  una  secuencia  ( ABC)n ,  y  las  demas  reglas  permiten  alterar  el  orden  de 
esta  secuencia  de  cualquier  rnanera.  Finalmente,  los  no  terminales  se  convierten  a  terminales. 


El  segundo  ejemplo  genera  otro  lenguaje  que  no  es  LC,  e  ilustra  como  una  GDC  permite 
funcionar  como  si  tuvieramos  un  cursor  sobre  la  cadena.  Esta  idea  es  esencial  para  probar 
la  equivalencia  con  MTs. 

Ejemplo  4.16  Una  GDC  que  genera  {a2",  n  >  0},  puede  ser  como  sigue:  V  =  {5,  [, ],  A,  D}  y  R 
conteniendo  las  reglas: 

S  — ►  [A]  [  >  [D 

[  — ►*  D]  — >  ] 

]  — »  e  DA — y  AAD 

A  — y  a 
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La  operatoria  es  como  sigue.  Primero  se  genera  [A],  Luego,  tantas  veces  como  se  quiera,  aparece 
el  “duplicador”  D  por  la  izquierda,  y  pasa  por  sobre  la  secuencia  duplicando  la  cantidad  de  T’s, 
para  desaparecer  por  la  derecha.  Finalmente,  se  eliminan  los  corchetes  y  las  T’s  se  convierten  en 
a's.  Si  bien  la  GDC  puede  intentar  operar  en  otro  orden,  es  facil  ver  que  no  puede  generar  otras 
cosas  (por  ejemplo,  si  se  le  ocurre  hacer  desaparecer  un  corchete  cuando  tiene  una  D  por  la  rnitad 
de  la  secuencia,  nunca  lograra  generar  nada;  tambien  puede  verse  que  aunque  se  tengan  varias  D’s 
simultaneas  en  la  cadena  no  se  pueden  producir  resultados  incorrectos) . 

Tal  como  las  MTs,  las  GDCs  son  tan  poderosas  qne  pneden  utilizarse  para  otras  cosas 
ademas  de  generar  lenguajes.  Por  ejemplo,  pneden  usarse  para  calcnlar  funciones: 

Definicion  4.31  Una  GDC  G  =  (V,  E,  R ,  S )  compnta  una  funcion  f  :  Eg  — y  Ej  si  existen 
cadenas  x,y,x',y'  G  (V  U  E)*  tal  que,  para  toda  u  G  Eg,  xuy  =^G  x'vy'  sii  v  =  f(u). 
Si  existe  tal  G  decimos  que  f  es  gramaticalmente  computable.  Esta  definicion  incluye  las 
funciones  de  N  en  N  mediante  convertir  In  en  . 

Ejemplo  4.17  Una  GDC  que  calcule  f(n)  =  2 n  es  parecida  a  la  del  Ej.  (4.16),  V  =  {D},  R 
conteniendo  la  regia  Da  — y  aaD ,  y  con  x  =  D,  y  =  e,  x'  =  e,  y'  =  D.  Notar  que  es  irrelevante 
cual  es  el  snnbolo  inicial  de  G. 


Otro  ejemplo  interesante,  que  ilustra  nuevamente  el  uso  de  cursores,  es  el  siguiente. 

Ejemplo  4.18  Una  GDC  que  calcule  f(w )  =  wR  con  E  =  {a,  6}  puede  ser  como  sigue:  x 
y  =  *\,x'=  [*,  y'  =],  y  las  reglas 


[a  — >  [A 
Aa  — >  aA 
Ah  — >  bA 
A*  — y  *a 


[b^[B 
Ba  — >  aB 
Bb — ybB 
B*  — y  *b 


Demostremos  aliora  que  las  GDCs  son  equivalentes  a  las  MTs.  Como  hacer  esto  no  es 
tan  claro  como  en  los  capltulos  anteriores,  porque  podemos  usar  tanto  las  GDCs  como  las 
MTs  para  diversos  propositos.  Pero  vamos  a  demostrar  algo  suficientemente  fundamental 
como  para  derivar  facilmente  lo  que  queramos. 

Lema  4.4  Sea  M  =  (. K ,  E,  5,  s )  una  MTD.  Entonces  existe  una  GDC  G  =  (V,  E,  R ,  S) 
donde  V  —  K  U  {h,  [,  ]}  tal  que  ( q,uav )  \~*M  (qfu'gfv')  sii  [uqav]  =^*G  [u'q'a'v']. 

Prueba:  Las  reglas  necesarias  se  construyen  en  funcion  de  5. 

1.  Si  S(qi,  a)  =  (q2,<)  agregamos  a  R  las  reglas  bq\ac  — y  q2bac  para  todo  6gE,  cGEU{]}, 
excepto  el  caso  ac  =  jf\,  donde  bqifi)  — y  q-fif  evita  que  queden  #’s  espurios  al  final  de  la 
configuracion. 
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2.  Si  8(qi,  a)  =  ( q2 ,  >)  agregamos  a  R  las  reglas  qicib  — >  aq2b  para  todo  b  £  E,  y  q\ci ]  — >  0(72#] 
para  extender  la  cinta  cuando  sea  necesario. 

3.  Si  5(qi,a)  =  (q2,b)  agregamos  a  R  la  regia  q\a  — )•  q2b. 

Es  facil  ver  por  inspection  que  estas  reglas  simulan  exactamente  el  comportamiento  de  M.  □ 
Con  el  Lema  4.4  es  facil  establecer  la  equivalencia  de  MTs  y  GDCs  para  calcular  funciones. 

Teorema  4.1  Toda  funcion  Turing -computable  es  gramaticalmente  computable,  y  viceversa. 

Prueba:  Sea  /  Turing-computable.  Entonces  existe  una  MTD  M  =  ( K ,  E,  5,  s )  tal  que  para  todo 
u ,  (s,  #«#)  \~*M  ( h ,  #/(it)#).  Por  el  Lema  4.4,  existe  una  GDC  G  tal  que  [#«s#]  [#/(u)/i#] 

(y  a  ninguna  otra  cadena  terminada  con  /*,#],  pues  M  es  determim'stica).  Entonces,  segun  la 
Def.  4.31,  /  es  gramaticalmente  computable,  si  elegimos  x  =  [#,  y  =  s#],  x'  =  [#,  y'  =  h#\. 

La  vuelta  no  la  probaremos  tan  detalladamente.  Luego  de  haber  construido  la  MUT 
(Section  4.6),  no  es  dificil  ver  que  uno  puede  poner  la  cadena  initial  (rematada  por  x  e  y  en 
las  dos  puntas)  en  la  cinta  1,  todas  las  reglas  en  una  cinta  2,  y  usar  una  MTND  que  elija  la  regia 
a  aplicar,  el  lugar  donde  aplicarla,  y  si  tal  cosa  es  posible,  carnbie  en  la  cinta  1  la  parte  izquierda 
de  la  regia  por  la  parte  derecha.  Luego  se  verifica  si  los  topes  de  la  cinta  son  x'  e  y' .  Si  lo  son,  la 
MTND  elimina  x'  e  y'  y  se  detiene,  sino  vuelve  a  elegir  otra  regia  e  itera.  En  este  caso  sabemos 
que  la  MTND  siempre  se  terminara  deteniendo  y  que  dejara  el  resultado  correcto  en  la  cinta  1.  □ 

Notese  que,  usando  esto,  podemos  hacer  una  GDC  que  “decida”  cualquier  lenguaje 
Turing-decidible  L.  Lo  curioso  es  que,  en  vez  de  generar  las  cadenas  de  L ,  esta  GLC  las 
convierte  a  S  o  a  N  segun  esten  o  no  en  L.  i Y  que  pasa  con  los  lcnguajes  Turing- aceptables? 
La  relation  exacta  entre  los  lcnguajes  generados  por  una  GDC  y  los  lcnguajes  decidibles 
o  aceptables  se  vera  en  el  proximo  capftulo,  pero  aquf  demostraremos  algo  relativamente 
sencillo  de  ver. 

Teorema  4.2  Sea  G  =  (V,  S,  R ,  S)  una  GDC.  Entonces  existe  una  MTND  M  tal  que,  para 
toda  cadena  w  G  L(G),  ( s ,  #)  \~*M  ( h ,  #w#). 

Prueba:  Similarmente  al  Teo.  4.1,  ponemos  todas  las  reglas  en  una  cinta  2,  y  #<S'#  en  la  cinta 
1.  Iterativamente,  elegimos  una  parte  izquierda  a  aplicar  de  la  cinta  2,  un  lugar  donde  aplicarla  en 
la  cinta  1,  y  si  tal  cosa  es  posible  (si  no  lo  es  la  MTND  cicla  para  siempre),  reemplazamos  la  parte 
izquierda  hallada  por  la  parte  derecha.  Verificamos  que  la  cinta  1  tenga  puros  terminales,  y  si  es 
asi  nos  detenemos.  Sino  volvemos  a  buscar  una  regia  a  aplicar.  □ 

El  teorema  nos  dice  que  una  MTND  puede,  en  cierto  sentido,  “generar”  en  la  cinta 
cualquier  cadena  de  un  lenguaje  DC.  Profundizaremos  lo  que  esto  significa  en  el  siguiente 
capftulo. 
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4.9  Ejercicios 

1.  Para  las  siguientes  MTs,  trace  la  secuencia  de  configuraciones  a  partir  de  la  que  se 
indica,  y  describa  informalmente  lo  que  hacen. 

(a)  M  =  ({g0,gi},{a,&,#},<S,g0),  con  6(q0,a)  =  (qi,b),  S(q0,b)  =  (gi,a),  6(q0,#)  = 
(h,  #),  S(qi,a)  =  (go,  >),  5  =  (qub)  =  (g0,>),  <S(gi,#)  =  (go,>)-  Configuration 
initial:  ( q0,aabbba ). 

(b)  M  =  ({go,  gi,  g2},  {a,  b,  #},  <5,  g0),  con  5(g0,a)  =  (gi,<),  S(q0,b)  =  (g0,  >), 
<#go,#)  =  (go,>)  ,  <J(gi,a)  =  (gi,<),  S(qub)  =  (g2,>),  5(gi,#)  = 
(gi,<),  %2,a)  =  (g2,  >),  S(q2,b)  =  (g2,  >),  <^(g2,#)  =  (g2,  #),  a  partir  de 
(go,  abb#bb##aba) . 

(c)  M  =  ({go,gi,g2},{a,#},^,go),  con  5(g0,a)  =  (gi,  <),  5(go,#)  =  (go,#), 
<5(gi,a)  =  (g2,  #),  5(gi,#)  =  (gi,  #),  <J(g2,a)  =  (g2,a),  5(g2,#)  =  (go,  <),  a 
partir  de  (g0,  #ano)  (n  >  0). 

2.  Constrnya  una  MT  que: 

(a)  Busque  hacia  la  izquierda  hasta  encontrar  aa  (dos  a  seguidas)  y  pare. 

(b)  Decida  el  lcnguaje  {w  G  {a,b}*,  w  contiene  al  menos  una  a}. 

(c)  Compute  f(w)  =  ww. 

(d)  Acepte  el  lenguaje  a*ba*b. 

(e)  Decida  el  lcnguaje  {w  G  {a,b}*,  w  contiene  tantas  a’s  como  6’s}. 

(f)  Compute  f(m,  n )  =  m  div  n  y  m  mod  n. 

(g)  Compute  f(m,n)  =  mn. 

(h)  Compute  f(m,n)  =  [logm  nj . 

3.  Considere  una  MT  donde  la  cinta  es  doblcmente  infinita  (en  arnbos  sentidos).  Definala 
formalmente  junto  con  su  operatoria.  Lnego  mnestre  que  se  puede  simular  con  una 
MT  normal. 

4.  Imagine  una  MT  qne  opere  sobre  una  cinta  2-dimensional,  infinita  hacia  la  derecha  y 
hacia  arriba.  Se  decide  qne  la  entrada  y  el  resultado  quedaran  escritos  en  la  primera 
hla.  La  maquina  pnede  moverse  en  las  cnatro  direcciones.  Simule  esta  maquina  para 
mostrar  qne  no  es  mas  potente  que  una  tradicional. 

5.  Imagine  una  MT  qne  posea  k  cabezales  pero  sobre  una  misma  cinta.  En  un  paso  lee 
los  k  caracteres,  y  para  cada  uno  decide  qne  escribir  y  adonde  moverse.  Descrfbala 
formalmente  y  muestre  como  simularla  con  un  solo  cabezal. 
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6.  Construya  MTNDs  que  realicen  las  siguientes  funciones. 

(a)  Acepte  a* abb* baa* . 

(b)  Acepte  {wwR,  w  G  {a,  &}*}. 

(c)  Acepte  {an,  3 p,  q  >  0,  n  =  p2  +  q2}. 

(d)  Termine  si  y  solo  si  el  Teorema  de  Fermat  es  falso  (3x,  y,  z,n  G  N,  n  >2 ,x,y,z> 
0,  xn  +  yn  =  zn ). 

7.  Codifique  las  MTs  del  Ejercicio  1  usando  p.  Siga  las  computaciones  sugeridas  en  la 
version  representada,  tal  como  las  haria  la  MUT. 

8.  Construya  una  GDC  que: 

(a)  Calcule  f(n)  =  2n. 

(b)  Genere  {anbncn,  n  >  0}. 

(c)  Genere  {tc  G  {a,  b ,  c}*,  w  tiene  mas  a’s  que  Us  y  mas  Us  que  c’s}. 

(d)  Genere  {ww,  w  G  {a,  b}*}. 


4.10  Preguntas  de  Controles 

A  continuation  se  muestran  algunos  ejercicios  de  controles  de  anos  pasados,  para  dar  una 
idea  de  lo  que  se  puede  esperar  en  los  proximos.  Hemos  omitido  (i)  (casi)  repeticiones,  ( ii ) 
cosas  que  ahora  no  se  ven,  (in)  cosas  que  ahora  se  dan  como  parte  de  la  materia  y/o  estan 
en  los  ejercicios  anteriores.  Por  lo  misrno  a  veces  los  ejercicios  se  han  alterado  un  poco  o  se 
presenta  solo  parte  de  ellos,  o  se  mezclan  versiones  de  ejercicios  de  distintos  anos  para  que 
no  sea  repetitivo. 

C2  1996  Cuando  usarnos  MT  para  simular  funciones  entre  naturales,  representamos 
al  entero  n  como  In.  Muestre  que  tambien  se  puede  trabajar  con  los  numeros 
representados  en  binario.  Suponga  que  tiene  una  MT  con  un  alfabeto  E  =  {0, 1} 
(puede  agregar  simbolos  si  lo  desea).  Siga  los  siguientes  pasos  (si  no  puede  hacer 
alguno  suponga  que  lo  hizo  y  siga  con  los  dernas): 

a)  Dibuje  una  MT  que  sume  1  a  su  entrada,  suponicndo  que  se  siguen  las 

convenciones  usuales  (el  cabezal  empieza  y  termina  al  final  del  nurnero),  por 
ejemplo  (s,  #011#)  (h,#  100#). 

b )  Similarmente  dibuje  una  MT  que  reste  1  a  su  entrada  si  es  que  esta  no  es  cero. 

c)  Explique  como  utilizaria  las  dos  maquinas  anteriores  para  implementar  la  suma 
y  diferencia  (dando  cero  cuando  el  resultado  es  negativo),  por  ejemplo  en  el  caso 
de  la  suma:  (s,# 011#101#)  —>■*  (h,  #1000#). 
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Ex  1996,  2001  Considere  los  automatas  de  2  pilas.  Estos  son  similares  a  los  de  una  pila, 
pero  pueden  actuar  sobre  las  dos  pilas  a  la  vez,  independientemente.  Aceptan  una 
cadena  cuando  llegan  a  un  estado  final,  independientemente  del  contenido  de  las  pilas. 

a)  Defina  formalmente  este  automata,  la  notion  de  configuration,  la  forma  en  que  se 

pasa  de  una  configuration  a  la  siguiente,  y  cl  lenguaje  que  acepta, 

b)  Use  un  automata  de  2  pilas  para  reconocer  el  lenguaje  {anbncn,  n  >  0}. 

c)  Muestre  como  puede  simular  el  funcionamiento  de  una  MT  cualquiera  usando  un 

automata  de  2  pilas.  Que  demuestra  esto  acerca  del  poder  de  estos  automatas? 

d)  Se  incrementa  cl  poder  si  agregamos  mas  pilas?  Por  que? 

C2  1997  Disene  una  MT  que  maneje  un  conjunto  indexado  por  claves.  En  la  cinta  viene 
una  secuencia  de  operaciones,  terminada  por  #.  Cada  operation  tiene  un  codigo  (un 
caracter)  y  luego  vienen  los  datos.  Las  operaciones  son 

•  Insert  ar:  El  codigo  es  /,  luego  viene  una  clave  (secuencia  de  ch'gitos)  y  luego 
cl  dato  (secuencia  de  letras  entre  ’a’  y  V).  Si  la  clave  ya  esta  en  el  conjunto, 
reemplazar  cl  dato  anterior. 

•  Borrar:  El  codigo  es  U,  luego  viene  una  clave.  Si  la  clave  no  esta  en  cl  conjunto, 
ignorar  el  comando,  sino  eliminarla. 

•  Buscar:  Viene  exactamente  una  operation  de  buscar  al  final  de  la  secuencia,  cl 
codigo  es  S  y  luego  viene  una  clave.  Se  debe  buscar  la  clave  y  si  se  la  encuentra 
dejar  escrito  en  la  cinta  cl  dato  correspondiente.  Si  no  se  la  encuentra  se  deja 
vatia  la  cinta. 

Para  mas  comodidad  suponga  que  las  claves  tienen  un  largo  fijo,  y  lo  mismo  con  los 
datos.  Mantenga  su  conjunto  en  una  cinta  auxiliar  de  la  forma  que  le  resulte  mas 
comoda.  Puede  usar  extensiones  de  la  MT,  como  otras  cintas,  no  determinismo,  etc., 
pero  el  diseno  de  la  MT  debe  ser  detallado. 

Ex  1997,  2001  Se  propone  la  siguiente  extension  a  la  MT  traditional:  en  vez  de  una  sola 
MT  tenemos  varias  (una  cantidad  fija)  que  operan  sobre  una  cinta  compartida ,  cada 
una  con  su  propio  cabezal.  A  cada  instruction,  cada  maquina  lee  cl  caracter  que 
corresponde  a  su  cabezal.  Una  vez  que  todas  leyeron,  cada  maquina  torna  una  action 
segun  el  caracter  lefdo  y  su  estado  actual.  La  action  puede  ser  mover  su  cabezal  o 
escribir  en  la  cinta.  Si  dos  maquinas  escriben  a  la  vez  en  una  misma  position  puede 
prevalecer  cualquiera  de  las  dos.  La  maquina  para  cuando  todas  paran. 

Explique  en  palabras  (pero  en  detalle)  como  puede  simular  esta  AIT  extendida  usando 
una  MT  traditional  (o  con  alguna  extension  vista). 
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Indique  como  utilizarfa  una  de  estas  maquinas  para  resolver  el  problema  de  ordenar 
una  entrada  de  K  caracteres  (no  necesariamente  todos  distintos)  del  alfabeto  E  = 
{<Ti,  <r2,  •  •  • ,  crn}  y  tal  que  ay  <  a2  <  ■  ■  ■  <  on.  Indique  el  numero  de  MT’s  originates 
que  la  componen  y  cual  seria  su  funcionamiento. 

C2  1998  Construya  (puede  usar  extensiones)  una  MT  que  reciba  en  la  cinta  1  una  cadena  de 
la  forma  Y  en  la  cinta  2  una  cadena  de  la  forma 

Se  supone  que  todas  las  cadenas  tq  y  v3  pertenecen  a  {a,  b}*,  y  que  tenemos  cl  mismo 
numero  de  cadenas  en  ambas  cintas. 

La  maquina  debe  detcrminar  si  las  tq  son  un  reordenamiento  de  las  Vj  o  no  y  detenerse 
solo  si  no  lo  son. 

C2  2002  Diseiie  una  gramatica  dependiente  del  contexto  que  genere  el  lenguaje  L  =  {an,  n 
es  un  numero  compuesto},  donde  un  numero  compuesto  es  cl  producto  de  dos  numeros 
mayores  que  uno. 

Ex  2002  La  Maquina  Gramatical  de  Turing  (MGT)  se  define  de  la  siguiente  forma. 
Recibe  p(G)p(w),  donde  G  es  una  gramatica  dependiente  del  contexto  y  p(G)  alguna 
representation  razonable  de  G\  y  una  cadena  w  representada  mediante  p{w).  La  MGT 
se  detiene  si  y  solo  si  w  e  L(G),  es  decir  acepta  el  lenguaje  C(MGT)  =  {p(G)p(w),  w  G 
L(G)}. 

Describa  la  forma  de  operar  de  la  MGT  (detalladamente,  pero  no  necesita  dibujar 
MT’s,  y  si  lo  hace  de  todos  modos  debe  explicar  que  se  supone  que  esta  haciendo). 

C2  2003  Diseiie  una  MT  que  calcule  el  factorial.  Formalmente,  la  maquina  M  debe  cumplir 

(s,  #/"#)  Mln'±) 

Puede  usar  varias  cintas  y  una  maquina  multiplicadora  si  lo  desea. 

C2  2003  Dada  una  MT  que  computa  una  funcion  /  :  E*  — >  E*,  indique  como  construir  una 
MT  que  compute  la  funcion  inversa  x  =  /-1(,tn)  para  algun  x  tal  que  f(x)  =  w  (puede 
hacer  lo  que  sea  si  no  existe  tal  x ).  Indique  que  hace  su  MT  cuando  (i)  existe  mas  de 
un  argumento  x  tal  que  f(x)  =  w]  (ii)  no  existe  ningun  argumento  x  tal  que  f(x)  =  w. 

Ex  2006  Considere  un  modelo  de  computacion  donde  una  MT  (robotizada)  puede,  mediante 
una  instruction  atomica,  fabricar  otra  MT.  La  nueva  MT  es  identica  y  arranca  con  la 
misma  configuration  de  la  MT  fabricante.  Para  poder  diferenciarlas,  la  MT  fabricante 
queda  con  un  0  bajo  cl  cabezal  luego  de  fabricar  la  copia,  mientras  que  la  copia  queda 
con  un  1  bajo  el  cabezal  cuando  arranca  su  ejecucion  luego  de  ser  copiada. 

Las  dos  MTs  siguen  trabajando  en  paralelo  y  sincronizadamente,  pero  sin  comunicarse. 
Tanto  la  copia  como  la  original  pueden  fabricar  nuevas  copias.  Cuando  alguna  copia 
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se  detiene,  envi'a  un  mensaje  a  todas  las  demas  para  que  se  detengan  tambien  y  se 
autodestruyan.  La  MT  que  termino  es  la  unica  que  sobrevive. 

Describa  formalmente  esta  nueva  MT:  incluya  la  definition  de  la  MT,  lo  que  es  una 
configuration,  como  se  pasa  de  una  configuration  a  la  siguiente,  la  notion  de  decidir  y 
aceptar,  y  cl  lenguaje  decidido  y  aceptado  por  una  MT. 

C2  2007  Un  automata  de  cola  es  igual  a  uno  de  pila,  excepto  que  en  vez  de  una  pila  usa 
una  cola  (es  decir,  los  simbolos  salen  en  cl  mismo  orden  en  que  entraron). 

1.  Defina  formalmente  un  automata  de  cola,  el  concepto  de  configuration  y  cl 
lenguaje  aceptado  por  este  automata. 

2.  Demuestre  que  un  automata  de  cola  puede  aceptar  un  lenguaje  que  no  es  libre 
del  contexto  (por  ejemplo  L  =  {ww,  w  G  {a,  &}*}). 

3.  Demuestre  que  un  automata  de  cola  puede  aceptar  cualquier  lenguaje  Turing- 
aceptable  (un  buen  comienzo  es  mostrar  que  puede  simular  la  tint  a  usando  la 
cola) . 

C2  2007  Considere  un  alfabeto  S  =  {cq,  a2, . . . ,  an}.  Definamos  el  orden  lexicografico  entre 
caracteres  como  a*  <  oq+i.  Dibuje  una  MT  que  reciba  en  la  entrada  una  cadena 
w  G  E*  y  la  ordene,  es  decir,  ponga  todos  los  caracteres  de  w  en  orden  lexicografico 

(por  ejemplo  (s,  #04020102#)  I-*  (h,  #01020204#)). 

(Note  que  n  es  fijo,  no  depende  del  largo  de  la  entrada.)  Puede  usar  varias  cintas,  pero 
no  una  cantidad  dependiente  de  n. 

Ex  2007  Sea  M  una  MT  que  siempre  termina  frente  a  su  entrada,  calculando  una  cierta 
funcion.  Demuestre  que  el  problema  de  determinar  si  la  funcion  que  M  calcula  es 
biyectiva  no  es  computable. 

Ex  2008  Sea  k- PA  un  automata  de  pila  con  k  pilas.  Por  lo  tanto  un  0-PA  es  un  AFND  y 
un  1-PA  es  un  simple  PA.  Se  sabe  que  un  1-PA  es  mas  poderoso  que  un  0-PA,  pues 
permite  reconocer  mas  lenguajes. 

1.  Mostrar  que  un  2-PA  es  mas  poderoso  que  un  1-PA. 

2.  Mostrar  que  un  3-PA  no  es  mas  poderoso  que  un  2-PA.  (Ayuda:  Piense  en  una 
MT) 

4.11  Proyectos 

1.  Familiaricese  con  JTV  (http://www.dcc.uchile.cl/jtv)  y  traduzca  algunas  de  las 
MTs  vistas,  tanto  MTDs  como  MTNDs,  para  simularlas. 
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2.  Dibuje  la  MUT  usando  JTV y  simule  algunas  ejecuciones. 

3.  Tome  algiin  lenguaje  ensamblador  y  muestre  que  las  funciones  que  puede  calcular  son 
las  mismas  que  en  nuestro  modelo  de  maquina  RAM. 

4.  Investigue  sobre  funciones  recursivas  como  modelo  alternativo  de  computation.  Una 
fuente  es  [LP81,  sec.  5.3  a  5.6]. 

5.  Investigue  sobre  lenguajes  simples  de  programacion  como  modelo  alternativo  de 
computabilidad.  Una  fuente  es  [DW83,  cap.  2  a  5].  Esto  entra  tambien  en  el  tema  del 
proximo  capitulo. 

6.  Investigue  mas  sobre  el  modelo  RAM  de  computation.  Una  fuente  es  [AHU74,  cap  1]. 
Esto  entra  tambien  en  el  tema  del  proximo  capitulo. 


Referencias 

[AHU74]  A.  Aho,  J.  Hopcroft,  J.  Ullman.  The  Design  and  Analysis  of  Computer  Algorithms. 
Addison- Wesley,  1974. 

[DW83]  M.  Davis,  E.  Weyuker.  Computability,  Complexity,  and  Languages.  Academic 
Press,  1983. 

[LP81]  H.  Lewis,  C.  Papadimitriou.  Elements  of  the  Theory  of  Computation.  Prentice-Hall, 
1981.  Existe  una  segunda  edition,  bastante  parecida,  de  1998. 


Capitulo  5 

Computabilidad 


[LP81,  cap  5  y  6] 

Una  vez  establecido  nuestro  modelo  de  computation  y  justificado  con  la  Tesis  de  Church, 
en  este  capitulo  vamos  por  fin  a  demostrar  los  resultados  centrales  de  que  cosas  se  pueden 
computar  y  que  cosas  no. 

Comenzaremos  con  una  famosa  demostracion  de  que  cl  problema  de  la  detencion  (o  halting 
problem)  no  se  puede  resolver  por  computador,  es  decir,  que  es  indecidiblc.  Esta  demostracion 
arroja  luz  sobre  la  diferencia  entre  decidir  y  aceptar  un  lenguaje.  Luego  profundizaremos 
mas  en  esa  relation,  y  finalmente  mostraremos  como  demostrar  que  otros  problemas  son 
indecidibles,  dando  ejemplos  de  problemas  al  parecer  relativamente  simples  que  no  tienen 
solution. 


5.1  El  Problema  de  la  Detencion 

Comencemos  con  algunas  observaciones  relativamente  simples  sobre  la  relation  entre  decidir 
y  aceptar  lenguajes. 

Lema  5.1  Si  un  lenguaje  L  es  decidible,  entonces  Lc  es  decidible. 

Prueba:  Si  L  es  decidible  entonces  existe  una  MT  M  que,  empezando  en  la  configuration 

(s,  ifcwjf)  \~*M  ( h ,  si  w  €  L  y  (s,  \~*M  (h,  #N^)  si  no.  Entonces,  basta  con  ejecutar  M 

y  luego  invertir  su  respuesta  para  decidir  Lc: 


>M  < 


S> 


N  > 


□ 


Lema  5.2  Si  un  lenguaje  L  es  decidible,  entonces  es  aceptable. 
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Prueba:  Si  L  es  decidible  entonces  existe  una  MT  M  que,  empezando  en  la  configuration 

(s,  ffwjf)  \~*M  ( h ,  #S#:)  si  w  €  L  y  (s,  jfwjf)  (/r,  #N^)  si  no.  Entonces,  la  siguiente  MT 

>M  <  N 


se  detiene  sii  w  €  L,  es  decir,  acepta  L  y  por  lo  tanto  L  es  aceptable.  □ 

El  lema  anterior  es  bastante  evidente:  si  podemos  responder  si  o  no  frente  a  una  cadena 
del  lenguaje,  claramente  podemos  detenernos  si  la  cadena  esta  en  cl  lenguaje  y  no  detenernos 
sino. 

Tal  como  hemos  visto  que  los  complementos  de  lenguajes  decidibles  son  decidibles, 
podriamos  preguntarnos  si  los  complementos  de  lenguajes  aceptables  son  aceptables.  El 
siguiente  lema  nos  dice  algo  al  respecto. 

Lema  5.3  Si  L  es  aceptable  y  Lc  es  aceptable,  entonces  L  es  decidible. 

Prueba:  Si  tenemos  una  M\  que  acepta  L  y  una  M2  que  acepta  Lc,  entonces,  dada  una  cadena 
w  exactamente  una  entre  M\  y  M2  se  detendran  frente  a  w.  Podemos  correr  una  MTND  M  que, 
no  determimsticamente,  elige  correr  M \  6  M2 ■  Lo  que  corre  en  el  caso  de  M\  es  realmente  una 
variante  que  funciona  en  la  cinta  2,  y  cambia  el  estado  h  por  Lo  que  corre  en  el  caso 

de  M2  es  realmente  una  variante  que  funciona  en  la  cinta  2,  y  cambia  el  estado  h  por  >(1)n(1)[>(1). 
Esta  claro  que  M  siempre  va  a  terminar  y  dejar  en  la  cinta  1  la  respuesta  S  o  N  segun  w  €  L  o  no. 
□ 


Por  lo  tanto,  si  los  complementos  de  los  lenguajes  aceptables  fueran  aceptables,  todos  los 
lenguajes  aceptables  serfan  decidibles.  La  pregunta  interesante  es  entonces:  ^sera  que  todo 
lenguaje  aceptable  es  decidible? 

Observacion  5.1  $Que  implicaciones  tendria  que  esto  fuera  verdad?  Esto  significaria  que, 
dada  una  MT  que  se  detuviera  solo  frente  a  cadenas  de  un  cierto  lenguaje  L,  podriamos 
construir  otra  que  se  detuviera  siempre,  y  nos  dijera  si  la  cadena  esta  en  L  0  no,  es  decir,  si 
la  primera  MT  se  detendria  frente  a  L  0  no.  Por  ejemplo,  no  seria  dificil  hacer  una  MTND 
que  intentara  demostrar  un  cierto  teorema  ( tal  como  hemos  hecho  una  que  intenta  generar 
cierta  palabra  con  una  GDC,  Teo.  f.2).  Luego  podriamos  saber  si  el  teorema  es  cierto  0  no 
mediante  preguntarnos  si  la  MTND  se  detendra  0  no.  jTendriamos  un  mecanismo  inf  alible 
para  saber  si  cualquier  teorema,  en  cualquier  sistema  formal,  es  demostrable  0  no!  Podriamos 
haber  resuelto  el  ultimo  teorema  de  Fermat  0  la  hipotesis  del  continuo  sin  mayor  esfuerzo, 
0  la  aun  no  demostrada  conjetura  de  Goldbach  (todo  numero  par  mayor  que  2  es  la  suma 
de  dos  primos).  Otra  forma  mas  pedestre  de  ver  esto  es  como  sigue.  Bastaria  hacer  un 
programa  que  fuera  generando  cada  contraejemplo  posible  a  la  conjetura  de  Goldbach  ( todos 
los  numeros  pares),  probara  si  es  la  suma  de  dos  primos,  y  se  detuviera  si  no.  Sabriamos  si 
la  conjetura  es  falsa  0  no  mediante  preguntarnos  si  el  programa  se  detendra  0  no. 
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Esta  observation,  ademas  de  adclantar  cierto  pesimismo  sobre  la  posibilidad  de  que  los 
lenguajes  aceptables  sean  decidibles,  muestra  que  un  cierto  lenguaje  en  particular  es  esencial 
para  responder  esta  pregunta. 

Definicion  5.1  El  problcma  de  la  detencion  (o  halting  problem,)  es  el  de,  dada  una  MT 
M  y  una  cadena  w,  determinar  si  M  se  detendra  frente  a  w,  es  decir,  si  M  acepta  w,  o 
formalmente,  si  (s,ffwff)  \~*M  ( h,uav )  para  algun  uav. 

Este  problema  se  puede  traducir  al  de  decidir  un  lenguaje,  gracias  al  formalismo 
introducido  para  la  MUT  (Section  4.6). 

Definicion  5.2  El  lenguaje  Kq  C  {/,  c}*  se  define  como  sigue: 

K0  =  {p(M)p(w),  M  acepta  w} 


Podemos  pensar  en  Kq,  informalmente,  como  cl  lenguaje  de  los  pares  ( M,w )  tal  que  M 
acepta  w.  Pero,  por  otro  lado,  Kq  es  nada  mas  que  un  conjunto  de  cadenas  de  c’s  e  J’s.  Es 
inmediato  que  K0  es  aceptable. 

Lema  5.4  K0  es  aceptable. 

Prueba: 

Basta  ver  que  la  MUT  definida  en  la  Def.  4.23  acepta  precisamente  I\q ,  mediante  simular  M 
frente  a  la  entrada  w.  Entonces  la  MUT  aceptara  p{M)p{w)  sii  M  acepta  w.  El  unico  detalle  es  que 
la  MUT  supone  que  la  entrada  es  de  la  forma  p{M)p(w),  mientras  que  ahora  deberfamos  primero 
verificar  que  la  secuencia  de  c’s  y  P s  de  la  entrada  tiene  esta  forma.  Si  no  la  tiene,  no  deberfamos 
aceptar  la  cadena  (es  decir,  deberfamos  entrar  a  un  loop  infinito).  No  es  diffcil  decidir  si  la  entrada 
tiene  la  forma  correcta,  queda  como  ejercicio  para  el  lector.  □ 

El  siguiente  lema  establece  la  importancia  de  K0  con  respecto  a  nuestra  pregunta. 

Lema  5.5  Kq  es  decidible  sii  todo  lenguaje  aceptable  es  decidible. 

Prueba:  La  vuelta  es  evidente  dado  que  Kq  es  aceptable.  Para  la  ida,  supongamos  que  Kq  es 
decidible,  es  decir,  existe  una  MT  Mq  que  decide  Kq:  dada  p(M)p(w),  responde  S  si  M  se  detendra 
frente  a  w,  y  N  sino  (o  si  la  entrada  no  es  de  la  forma  p{M)p(w)).  Ahora  supongamos  que  un  cierto 
L  es  aceptable:  tenemos  una  MT  M  que  se  detiene  frente  a  w  sii  w  €  L.  Construimos  una  MT 
M'  que  escriba  en  la  cinta  p{M)  (una  constante)  y  luego  codifique  w  como  p(w).  A  la  entrada 
resultante,  p(M)p(u>),  se  le  aplica  la  MT  que  decide  Kq,  con  lo  cual  nos  respondera,  finalmente,  si 
w  £  L  o  no.  □ 

De  este  modo,  nuestra  pregunta  se  reduce  a  ^es  Kq  decidible?  Para  avanzar  en  este 
sentido,  definiremos  un  lenguaje  K\  a  partir  de  Kq. 
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Definicion  5.3  El  lenguaje  K\  se  define  como 

Ki  =  {p(M),  M  acepta  p(M)} 

y  asimismo  vale  la  pena  escribir  explicitamente 

=  {w  G  {c, /}*,  w  es  de  la  forma  p(M )  y  M  no  acepta  p(M), 
o  w  no  es  de  la  forma  p(M)} 

Para  que  esto  tenga  sentido,  debemos  aclarar  que  estamos  hablando  de  MTs  M  codificables 
(Def.  f.18),  y  de  que  acepten  la  version  codificada  de  p(M). 

Observacion  5.2  Antes  de  continuar,  aseguremosnos  de  entender  el  tecnicismo  involucrado 
en  la  definicion  de  K\.  No  todas  las  MTs  tienen  un  alfabeto  formado  por  c’s  y  I ’s,  de  modo 
que  ique  sentido  tiene  decir  que  aceptan  p(M),  que  es  una  secuencia  de  c’s  y  I's?  Lo  que 
aclara  la  definicion  es  que  no  nos  referimos  a  cualquier  MT  sino  a  MTs  codificables,  cuyo 
alfabeto  es  de  la  forma  a  i ,  a2,  etc.  (Def.  f.18).  A  su  vez,  hablamos  de  la  version  codificada  de 
p(M),  donde,  por  ejemplo,  c  se  convierte  en  a2  el  en  a3  (recordemos  que  a\  esta  reservado 
para  el  #).  Ahora  si  funciona:  toda  MT  que  tenga  al  menos  tres  simbolos  en  su  alfabeto 
(que  renombramos  a3,  a2  y  a3)  aceptan  0  no  cadenas  formadas  por  a2  y  a3,  y  Kx  son  las 
MTs  tales  que  si  las  codificamos  con  c’s  e  I ’s,  traducimos  esa  codificacion  a  a2’s  y  a3 ’s,  y 
se  las  damos  como  entrada  a  la  misma  M,  terminaran.  Y  las  MTs  que  tienen  alfabetos  de 
menos  de  tres  simbolos?  Pues  las  dejamos  fuera  de  Kx. 

Una  vez  comprendido  el  tecnicismo,  es  bneno  no  prestarle  mucha  antencion  y  tratar  de 
entender  mas  intuitivamente  que  es  K±.  Esencialmente,  Kx  es  el  conjnnto  de  las  MTs  qne 
se  aceptan  a  si  mismas.  Similarmente,  Kx  seria  cl  conjnnto  de  las  MTs  que  no  se  aceptan  a 
si  mismas  (mas  las  cadenas  que  no  representan  ninguna  p(M)). 

El  siguiente  lema  deberia  ser  evidente. 

Lema  5.6  Si  K0  es  aceptable/decidible,  entonces  K\  es  aceptable/decidible.  Por  lo  tanto 
Ki  es  aceptable. 

Prueba:  Sea  M  que  acepta/decide  Kq.  Entonces  una  M'  que  acepta/decide  K\  simplemente 
recibe  p(Af)  en  la  cinta  de  entrada,  le  concatena  p{p(M)),  e  invoca  M.  La  doble  p  se  debe  a  que 
estamos  codificando  la  cadena  w  =  p(M)  en  el  lenguaje  de  c’s  e  I’s  ja  pesar  de  que  ya  lo  estuviera! 
Es  decir,  si  c  =  a2  y  I  =  a3,  entonces  c  se  (re)codiftcara  como  IIII  e  I  como  /////.  □ 

Notar  que  bastaria  que  K(  fuera  aceptable  para  que  Kx  fuera  decidible.  En  seguida 
demostraremos  que  no  lo  es. 

Antes  de  ir  a  la  demostraeion  formal,  es  muy  ilustrativo  recurrir  a  la  paradoja  del  barbero 
de  Russell  (usada  originalmente  para  demostrar  que  no  toda  propiedad  define  un  conjnnto). 
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Definicion  5.4  La  paradoja  del  barbero  de  Russell  es  como  sigue:  Erase  un  pueblo  con 
un  cierto  numero  de  barberos.  Estos  afeitaban  a  los  que  no  eran  barberos.  Pero  $quien  los 
afeitaria  a  ellos?  Algunos  querian  afeitarse  ellos  mismos,  otros  preferian  que  los  afeitara 
otro  barbero.  Despues  de  discutir  varios  dias,  decidieron  nombrar  a  uno  solo  de  ellos  como  cl 
barbero  de  todos  los  barberos.  Este  barbero,  entonces,  estaria  a  cargo  de  afeitar  exactamente 
a  todos  los  barberos  que  no  se  afeitaran  a  si  mismos.  El  barbero  designado  quedo  muy  contento 
con  su  nombramiento,  hasta  que  a  la  manana  siguiente  se  pregunto  quien  lo  afeitaria  a  el. 
Si  se  afeitaba  el  mismo,  entonces  estaba  afeitando  a  alguien  que  se  afeitaba  a  si  mismo, 
incumpliendo  su  designacion.  Pero  si  no  se  afeitaba  el  mismo,  entonces  no  estaria  afeitando 
a  alguien  que  no  se  afeitaba  a  si  mismo,  tambien  incumpliendo  su  designacion.  El  barbero 
renuncio  y  nunca  lograron  encontrar  un  reemplazante. 

La  paradoja  muestra  que  no  es  posible  tener  un  barbero  que  afeite  exactamente  a  los 
barberos  qne  no  se  afeitan  a  si  mismos.  Si  cambiamos  “barbero”  por  “MT”  y  “afeitar”  por 
“aceptar”  habremos  comprendido  la  esencia  del  siguiente  lcma. 

Lema  5.7  K(  no  es  aceptable. 

Prueba:  Supongamos  que  lo  fuera.  Entonces  existira  una  MT  M  que  acepta  /if.  Nos  preguntamos 
entonces  si  la  version  codificable  de  M  acepta  la  cadena  w  =  p(M)  (codificada). 

1.  Si  la  acepta,  entonces  p(M)  £  K\  por  la  Def.  5.3.  Pero  entonces  M  acepta  una  cadena 
w  =  p(M)  que  no  esta  en  1/f  sino  en  K\ ,  contradiciendo  el  hecho  de  que  M  acepta  lif- 

2.  Si  no  la  acepta,  entonces  p(M)  €  /if  por  la  Def.  5.3.  Pero  entonces  A/  no  acepta  una  cadena 
w  =  p(M)  que  esta  en  /if,  nuevamente  contradiciendo  el  hecho  de  que  M  acepta  /if. 

En  ambos  casos  llegamos  a  una  contradiction,  que  partio  del  hecho  de  suponer  que  existia  una  M 
que  aceptaba  /if-  Entonces  lif  no  es  aceptable.  □ 

Observacion  5.3  La  demostracion  del  Lema  5.1  es  una  forma  de  diagonalizacion  (usado 
en  el  Teo.  1.2).  En  una  matriz,  enumeramos  cada  MT  M  en  una  fila,  y  cada  cadena  w  en 
una  columna.  Cada  celda  vale  1  si  la  MT  (fila)  se  detiene  frente  a  la  cadena  (columna).  En 
cada  fila  i  de  una  MT  Mi,  una  de  las  celdas  (llamemosla  Ci)  corresponde  a  la  cadena  p(Mj). 
Una  MT  que  aceptara  /if  deberia  tener  un  0  en  Ci  si  la  MT  Mj  tiene  un  1  (se  acepta  a  si 
misma)  y  un  1  en  Ci  si  Mi  tiene  un  0  (no  se  acepta  a  si  misma).  Pero  entonces  esa  MT  que 
acepta  /if  no  puede  ser  ninguna  de  las  MT  listadas,  pues  difiere  de  cada  fila  i  de  la  matriz 
en  la  columna  Ci.  Por  lo  tanto  no  existe  ninguna  MT  que  acepte  /if- 

De  aquf  derivamos  el  teorema  mas  importante  del  curso.  Contiene  varias  afirmaciones 
relacionadas. 

Teorema  5.1  K0  y  K\  son  aceptables  pero  no  decidibles.  Ni  Kq  ni  /if  son  aceptables. 
Existen  lenguajes  aceptables  y  no  decidibles.  No  todos  los  complementos  de  lenguajes 
aceptables  son  aceptables.  El  problema  de  la  detencion  es  indecidible. 
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Prueba:  K\  no  es  decidible  porque  si  lo  fuera  entonces  K f  tambien  serfa  decidible  (Lema  5.1), 
y  ya  vimos  que  Kf  no  es  siquiera  aceptable  (Lema  5.7).  Como  K\  no  es  decidible,  Kq  tampoco 
lo  es  (Lema  5.6),  y  por  el  mismo  lema,  como  Kf  no  es  aceptable,  Kq  tampoco  lo  es.  Como  Kq  y 
K\  son  aceptables  y  no  decidibles,  no  todo  lenguaje  aceptable  es  decidible,  y  no  todo  complemento 
de  lenguaje  aceptable  es  aceptable  (pues  sino  todos  los  lenguajes  aceptables  serian  decidibles, 
Lema  5.3).  En  particular,  el  problema  de  la  detention  (decidir  Kq)  es  indecidible.  □ 

Observation  5.4  Esto  signified,  en  particular,  que  es  imposible  determinar  si  un  programa 
se  detendra  f rente  a  una  entrada.  Es  decir,  en  general.  Para  ciertos  programas  y/o  ciertas  entradas 
puede  ser  muy  facil,  pero  no  se  puede  tener  un  metodo  que  siempre  funcione.  Los  metodos  de  verificacion 
automatica  de  programas  (que  intentan  demostrar  su  correctitud)  no  tienen  esperanza  de 
algun  dia  funcionar  en  forma  totalmente  automatica,  pues  ni  siquiera  es  posible  saber  si  un 
programa  se  detendra. 

El  hecho  de  que  las  MTs  puedan  no  detenerse  parece  ser  un  problema.  ^No  serfa  rnejor 
tener  un  formalismo  de  computation  donde  todos  los  programas  terminaran?  Por  ejemplo 
un  lengnaje  de  programacion  sin  WHILE,  sino  solo  con  un  tipo  de  For  qne  garantizara 
termination.  Si  nos  acostumbraramos  a  programar  asf,  se  evitarfan  muchos  errores. 

El  siguiente  teorema  demnestra  qne  no  es  asi.  Todo  mecanismo  de  computacion,  para  ser 
tan  completo  como  las  MTs,  requiere  que  existan  programas  que  no  terminan  y  mas  aun,  que 
sea  indecidible  saber  si  terminaran  o  no.  (En  todos  los  formalismos  alternatives  mencionados 
en  la  Section  4.7  existen  instrncciones  qne  permiten  la  no  termination.) 

Teorema  5.2  Sea  un  mecanismo  de  computacion  de  funciones  de  N  en  N,  tal  que  existe 
una  forma  finita  de  representar  las  funciones  como  secuencias  de  simbolos,  de  verificar  la 
correctitud  de  una  representacion,  y  de  simular  las  funciones  con  una  MT  a  partir  de  la 
representacion,  de  modo  que  la  simulacion  siempre  termina.  Entonces  existen  funciones 
computables  con  MTs  y  que  no  se  pueden  calcular  con  este  mecanismo. 

Prueba:  Llamemos  fi  a  la  i-esima  representacion  correcta  de  una  funcion  que  aparece  cuando 
se  van  generando  todas  las  cadenas  posibles  en  orden  de  longitud  creciente  y,  dentro  de  la  misrna 
longitud,  en  orden  lexicografico.  Definamos  la  matriz  Ft  j  =  ffij).  Ahora,  sea  /(n)  =  fn(n )  +  1. 
Claramente  esta  funcion  no  esta  en  la  matriz,  pues  difiere  de  cada  fi  en  el  valor  fi(i),  y  por  lo  tanto 
no  puede  computarse  con  el  nuevo  mecanismo.  Sin  embargo,  una  MT  puede  calcularla:  Basta 
enumerar  cadenas  e  ir  verificando  si  representan  funciones  correctas,  deteniendonos  en  la  n-esima, 
simulando  su  funcionamiento  con  el  argumento  n,  y  finalmente  sumando  1  al  resultado.  □ 

El  teorema  esta  expresado  en  term  in  os  de  funciones  de  natnrales  en  natnrales,  pero  no 
es  diffcil  adaptarlo  a  lo  qne  se  desee.  El  enunciado  se  ve  un  poco  tecnico  pero  no  tiene 
nada  muy  restrictivo.  Es  diffcil  imaginarse  un  sistema  razonable  de  computacion  donde  las 
funciones  no  pnedan  enumerarse  (esto  ya  lo  hemos  discutido  en  la  Section  4.7),  lo  qne  es  lo 
mismo  qne  representarse  como  una  secnencia  de  algnna  forma;  o  qne  no  se  pueda  saber  si 
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una  secuencia  representa  una  description  sintacticamente  correcta  de  una  funcion;  o  que  no 
pneda  simularse  con  una  MT  a  partir  de  la  representation  (Tesis  de  Church). 

^Eri  que  falla  cl  teorema  si  lo  tratamos  de  aplicar  a  un  formalismo  donde  algunas  f(i) 
pueden  no  terminar?  En  que,  si  resulta  que  fn (n)  no  termina,  no  podremos  “sumarle  1”. 
Nuestro  mecanismo  propuesto  para  calcular  fn  (n)  +  1  tampoco  terminara.  Ni  siquiera 
podremos  decidir  darlc  un  valor  determinado  a  las  que  no  terminan,  porque  no  tenemos 
forma  de  saber  si  termina  o  no.  Cualquier  valor  que  lc  demos  a  fin),  puede  que  fn(n) 
finalmente  termine  y  entregue  el  mismo  valor.  Por  lo  tanto,  es  esencial  que  haya  funciones 
que  no  terminan,  y  que  cl  problema  de  la  detention  sea  indecidible,  para  que  un  sistema  de 
computation  sea  completo. 

5.2  Decidir,  Aceptar,  Enumerar 

En  esta  section  veremos  algunas  formas  alternativas  de  pensar  en  lcnguajes  aceptables  y 
decidibles,  que  seran  utiles  para  demostrar  la  indecidibilidad  de  otros  problemas. 

Definition  5.5  El  lenguaje  de  salida  de  una  MT  M  es  el  conjunto 

{W  G  (E  —  {#})*,  3u  E  (E  -  {#})*,  (a,  #u#)  b*,  (h,  #tc#)  } 

En  el  caso  de  que  M  compute  una  funcion  f ,  esto  es  la  imagen  de  f . 

El  siguiente  lema  dice  que  los  lcnguajes  aceptables  son  los  lcnguajes  de  salida. 

Lema  5.8  Un  lenguaje  es  aceptable  sii  es  el  lenguaje  de  salida  de  alguna  MT. 

Prueba:  Sea  L  un  lenguaje  aceptado  por  una  MT  M.  Crearemos  una  MT  M'  que  calcule  la 
funcion  f(w)  =  w  para  las  w  fly  no  se  detenga  si  w  (f  L.  Claramente  L  sera  el  lenguaje  de  salida 
de  M' .  M'  simplemente  copia  la  entrada  w  a  la  cinta  2  y  corre  M  en  la  cinta  2.  Si  M  termina 
(w  €  L ),  la  salida  que  quedara  sera  la  de  la  cinta  1.  Si  M  no  termina  (w  0  L),  M'  tampoco 
termina. 

Sea  ahora  L  el  lenguaje  de  salida  de  una  MT  A I.  Para  aceptar  L,  una  MTND  puede  generar 
no  determim'sticamente  una  u  en  una  cinta  2,  correr  M  sobre  ella  en  la  cinta  2,  y  detenerse  solo  si 
el  result  ado  de  la  cinta  2  es  igual  al  de  la  cinta  f.  □ 

Otra  caracterizacion  interesante  de  los  lenguajes  aceptables  tiene  que  ver  con  cl  usar  una 
MT  para  enumerar  cadenas. 

Definition  5.6  Un  lenguaje  L  es  Turing-enumerable  o  simplemente  enumerable  si  existe 
una  MT  M  =  (K,  E,  S,  s)  y  un  estado  q  e  K  tal  que 


L 


G  (E  —  {#})*,  3u  G  S*,  (a,  #)  h*M  (q, 
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Esto  signified  que  M  se  arranca  en  la  cinta  vacia  y  va  dejando  las  cadenas  de  L  en  la  cinta, 
una  por  vez,  pasando  por  q  para  indicar  que  ha  generado  una  nueva  cadena,  y  guardando 
luego  del  cabezal  la  informacion  necesaria  para  continuar  generando  cadenas.  Notese  que  se 
permite  generar  una  misma  cadena  varias  veces. 

Lema  5.9  Un  lenguaje  L  es  enumerable  sii  es  aceptable. 

Prueba:  Si  L  es  aceptado  por  una  MT  M,  podemos  crear  una  MTND  que  genere  todas  las 

cadenas  posibles  w.  Una  vez  generada  una  cadena  w  no  determimsticamente,  la  copia  a  la  cinta  2 
y  corre  M  sobre  ella.  En  caso  de  que  M  termine,  la  simulacion  de  la  MTND  no  se  detiene  corno 
en  el  caso  usual,  sino  que  almacena  las  directivas  (recordar  Section  4.5)  luego  de  fi'wfi  en  la  cinta 
1,  y  recien  retoma  la  simulacion  de  la  MTND. 

Si  L  es  enumerado  por  una  MT  M,  es  facil  aceptarlo.  Dada  una  w  en  la  cinta  1,  corremos  M 
en  la  cinta  2.  Cada  vez  que  M  genera  una  nueva  cadena  w'  pasando  por  su  estado  q,  comparamos 
w  con  w'  y  nos  detenemos  si  w  =  w',  sino  retomamos  la  ejecucion  de  M .  □ 

Finalmente,  estamos  en  condiciones  de  establecer  la  relation  entre  GDCs  y  MTs. 

Teorema  5.3  Un  lenguaje  L  es  generado  por  una  GDC  sii  es  aceptable. 

Prueba:  Primero  veamos  que  si  L  es  generado  por  una  GDC,  entonces  es  enumerable  (en  vez  de 
aceptable).  Esto  es  prcticamente  lo  que  hicimos  en  el  Teo.  4.2,  mostrando  que  existe  una  MTND 
que  produce  cada  cadena  de  L  a  partir  de  la  cinta  vacia.  Cada  vez  que  esta  MTND  genere  una 
cadena,  pasamos  por  un  estado  especial  q  y  detrs  de  la  cadena  almacenamos  la  informacin  necesaria 
para  continuar  la  simulacin  (por  ejemplo  el  contenido  de  las  cintas). 

Inversamente,  si  L  es  aceptable,  entonces  es  el  lenguaje  de  salida  de  una  MT  M.  Podemos 
construir  una  GDC  G  que  genere  las  cadenas  de  ese  lenguaje  de  salida  de  la  siguiente  forma. 
Primero  generamos  cualquier  configuration  posible  de  comienzo  con  S  — >  C  — >  aC  para 

cada  a  €  £  —  {#},  y  C  — >  s#.  Luego,  agregamos  a  la  GDC  las  reglas  que  le  permiten  simular  M 
(Lema  4.4),  de  rnodo  que  (s,  #u#)  \~*M  (h,  #w#)  sii  [jjusfij  [fiwhjfl-  Con  esto  G  sera  capaz 
de  generar  todas  las  cadenas  [#wh#\  tal  que  w  €  L.  Finalmente,  eliminamos  los  terminadores  de 
la  cadena  con  unas  pocas  reglas  adicionales:  hfi\  — >  X ,  aX  — y  Xa  para  todo  a  €  E  —  {#},  y 
[#X  — ►  e.  □ 

5.3  Demostrando  Indecidibilidad  por  Reduccion 

En  esta  section  veremos  corno  se  puede  usar  la  indecidibildad  del  problema  de  la  detention 
para  demostrar  que  otros  problemas  tambien  son  indecidibles. 

La  herramienta  fundamental  es  la  reduccion.  Si  tengo  un  problema  A  que  quiero  probar 
indecidible,  y  otro  B  que  se  que  es  indecidible,  la  idea  es  mostrar  corno,  con  una  MT  que 
decidiera  A,  podria  construir  una  que  decidiera  B.  Diremos  que  reducimos  el  problema  B 
(que  sabemos  indecidible)  al  problema  A  (que  queremos  probar  indecidible),  estableciendo, 
intuitivamente,  que  A  no  es  mas  facil  que  B. 

Probaremos  primero  varios  resultados  de  indecidibildad  sobre  MTs. 
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Lema  5.10  Los  siguientes  problemas  sobre  MTs  son  indecidibles: 

1.  Dadas  M  y  w,  $M  se  detiene  frente  aw? 

2.  Dada  M,  $se  detiene  arrancada  con  la  cinta  vacia? 

3.  Dada  M ,  $ se  detiene  frente  a  alguna/toda  entrada  posible? 

4-  Dadas  M\  y  M2,  j,se  detienen  frente  a  las  mismas  cadenas?  Es  decir,  & aceptan  el 
mismo  lenguaje? 

5.  Dadas  Mi  y  M2  que  calculan  funciones,  $ calculan  la  misma  funcion? 

6.  Dada  M,  $el  lenguaje  que  acepta  M  es  fmito?  regular ?  & libre  del  contexto? 

idecidible? 

Prueba: 

1.  Es  exactamente  lo  que  probamos  en  el  Teo.  5.1. 

2.  Supongamos  que  pudieramos  decidir  ese  problema.  Entonces,  para  decidir  1.  con  M  y  w, 
creariamos  una  nueva  M'  =  t>tci  >  w2  ■  ■  ■  O  >  M.  Esta  M\  arrancada  en  la  cinta  vacia, 
primero  escribe  w  y  luego  arranca  M,  de  rnodo  que  M'  termina  frente  a  la  cinta  vacia  sii  M 
acepta  w. 

3.  Si  pudieramos  decidir  ese  problema,  podriamos  resolver  2.  para  una  MT  M  creando  M'  = 
B M  (Def.  4.10),  que  borra  la  entrada  y  luego  arranca  M  sobre  la  cinta  vacia.  Entonces  M' 
se  detiene  frente  a  alguna/toda  entrada  sii  M  se  detiene  frente  a  la  cinta  vacia. 

4.  Si  pudieramos  decidir  ese  problema,  podriamos  resolver  3.  para  una  MT  M,  creando  una  M2 
que  nunca  se  detuviera  frente  a  nada  (S(s,a)  =  ( s,a )  para  todo  a  €  S)  y  preguntando  si 
Mi  =  M  se  detiene  frente  a  las  mismas  entradas  que  M2  (para  el  caso  “se  detiene  frente  a 
alguna  entrada  posible” ;  para  el  otro  caso,  la  M2  se  deberia  detener  siempre,  5(s,  a)  =  (. h ,  a)). 

5.  Si  pudieramos  decidir  ese  problema,  podriamos  resolver  1.  para  una  MT  M  y  una  cadena 
w.  Hariamos  una  M'  a  partir  de  (. M,w )  que  calcule  f(n)  =  1  si  M  acepta  w  en  menos  de 
n  pasos,  y  f(n)  =  0  sino.  Es  facil  construir  M'  a  partir  de  M,  mediante  simularla  durante 
n  pasos  y  responder.  Ahora  haremos  una  Mo  que  calcule  fo(n)  =  0  para  todo  n.  Entonces 
M  se  detiene  frente  a  w  sii  M'  y  Mq  no  calculan  la  misma  funcion.  Esto  muestra  que  tampoco 
puede  decirse  si  una  funcion  computable  alguna  vez  entregara  un  cierto  valor. 

6.  Si  pudieramos  decidir  ese  problema,  podriamos  resolver  2.  para  una  MT  M,  de  la  siguiente 
forma.  Creariamos  una  MT  M'  que  primero  corriera  M  en  la  cinta  2,  y  en  caso  de  que  M 
terminara,  corriera  la  MUT  (Def.  4.23)  sobre  la  entrada  real  de  la  cinta  1.  Entonces,  si  M 
no  se  detiene  frente  a  la  cinta  vacia,  M'  no  acepta  ninguna  cadena  (pues  nunca  llega  a  mirar 
la  entrada,  se  queda  pegada  en  correr  M  en  la  cinta  2)  y  por  lo  tanto  el  lenguaje  que  acepta 
M'  es  0.  Si  M  se  detiene,  entonces  M'  se  comporta  exactamente  corno  la  MUT,  por  lo  que 
acepta  Kq.  Podemos  entonces  saber  si  M  se  detiene  o  no  frente  a  la  cinta  vacia  porque  0  es 
finito,  regular,  libre  del  contexto  y  decidible,  mientras  que  Kq  no  es  ninguna  de  esas  cosas. 
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Veamos  ahora  algunas  reducciones  relacionadas  con  GDCs. 

Lema  5.11  Los  siguientes  problemas  sobre  GDCs  son  indecidibles: 

1.  Dadas  G  y  w,  $G  genera  w? 

2.  Dada  G,  genera  alguna  cadena?  $ genera  toda  cadena  posible? 

3.  Dadas  G\  y  G2,  igeneran  el  mismo  lenguaje? 

4-  Dada  G  y  w,  z  G  (V  U  £)* ,  $w  =^*G  z? 

Prueba: 

1.  Si  esto  fuera  posible,  tomariamos  cualquier  lenguaje  aceptable,  construiriamos  la  GDC  G  que 
lo  genera  como  en  el  Teo.  5.3,  y  podriamos  decidir  si  una  w  dada  esta  en  el  lenguaje  o  no. 

2.  Si  esto  fuera  posible,  podriamos  saber  si  una  MT  acepta  alguna/toda  cadena  o  no  (punto 

3.  en  el  Lema  5.10),  mediante  obtener  nuevamente  la  GDC  que  genera  el  lenguaje  que  la  MT 
acepta  y  preguntarnos  si  esa  GDC  genera  alguna/toda  cadena. 

3.  Si  esto  fuera  posible,  podriamos  saber  si  dos  MTs  aceptan  el  mismo  lenguaje  (punto  4.  en 
el  Lema  5.10),  mediante  obtener  las  GDCs  que  generan  los  lenguajes  que  las  MT  aceptan  y 
preguntarnos  si  son  iguales. 

4.  Si  esto  fuera  posible,  podriamos  saber  si  una  MT  M  se  detiene  frente  a  la  cinta  vacia  (punto 
2.  en  el  Lema  5.10),  mediante  generar  una  M'  que  ejecute  M  en  la  cinta  2.  Esta  M'  va  de 
(s,  jf)  a  (h,  #)  sii  M  se  detiene  frente  a  la  cinta  vacia.  Si  ahora  aplicamos  la  construction  del 
Lema  4.4,  obtenemos  una  G  que  lleva  de  a  [h#\  sii  M  se  detiene  frente  a  la  cinta  vacia. 

□ 


5.4  Otros  Problemas  Indecidibles 

Hasta  ahora  hemos  obtenido  problemas  indecidibles  relacionados  con  MTs  y  GDCs.  Esto 
puede  ser  lo  mas  natural,  pero  es  esperablc  que  podamos  exhibir  problemas  indecidibles  de 
tipo  mas  general. 

Comencemos  con  un  problcma  que  tiene  semejanza  con  un  juego  de  domino. 

Definicion  5.7  Un  sistema  de  correspondence  de  Post  es  un  conjunto  finito  de  pares  P  = 
{(wi,Ui),  (u2,V2),  ■  ■ .  ,(un,vn)},  con  Ui,Vi  G  E+.  El  problcma  de  correspondence  de  Post 
es,  dado  un  sistema  P,  determinar  si  existe  una  cadena  w  G  E+  (llamada  solution/  tal  que 
w  =  . .  .Uik  =  VixVi2 . . .  Vik  para  una  secuencia  q,  i2, . . . ,  ik  de  pares  de  P  a  usar  ( los 

pares  pueden  repetirse). 
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Ejemplo  5.1  El  problema  de  correspondencia  de  Post  para  el  sistema  P  = 
{(ca,  a),  (a,  a&),  (6,  ca),  (aftc,  c)}  tiene  solucion  abcaaabc ,  que  se  obtiene  utilizando  los  pares 
(a,  a&),  (6,  ca),  (ca,  a),  (a,  a&),  (a6c,  c):  concatenando  las  primeras  o  las  segundas  componentes  se 


obtiene  la  misma  cadena.  En  este  caso  i\  = 
como  fichas  de  domino: 

2,  12  = 

CO 

-S3. 

CO 

=  1,  k 

=  2,  : 

k  =  4.  Es  util  ver  los  pares 

ca 

a 

b 

abc 

a 

ab 

ca 

c 

donde  buscamos  pegar  una  secuencia  de  fichas  de  rnodo  de  que  se  lea  la  misma  cadena  arriba  y 
abajo: 


a 

b 

ca 

a 

abc 

ab 

ca 

a 

ab 

c 

Una  variante  del  problema,  util  para  demostrar  varios  result  ados,  es  la  siguiente,  donde 
se  fija  cual  debe  ser  el  primer  par  a  usar. 

Definicion  5.8  Un  sistema  de  Post  modificado  es  un  par  (P,  (x,  y )),  donde  P  es  un  sistema 
de  correspondencia  de  Post  y  (x,y)  G  P.  El  problema  de  Post  modificado  es  encontrar  una 
cadena  w  G  E+  tal  que  w  =  . .  .Uik  =  . . .  Vik  para  una  secuencia  ii,  k, . . . ,  ik, 

donde  i\  corresponde  a  (x,y). 

Lo  primero  a  mostrar  es  que  resolver  un  sistema  de  Post  no  es  mas  facil  que  resolver  uno 
modificado. 

Lema  5.12  Dado  un  sistema  de  Post  modificado  (P,  (x,y)),  podemos  crear  un  sistema  de 
Post  P'  tal  que  (P,  (x,y))  tiene  solucion  sii  P'  la  tiene. 

Prueba:  Debemos  crear  P'  de  manera  de  obligar  a  que  ( x ,  y)  sea  el  primer  par  utilizado. 

Definamos  L(w)  =  *w\  *  u>2  ■  ■  ■  *  w\w\  y  R(w)  =  w\  *  W2  *  ■  ■  ■  w\w\  *.  Comenzaremos  insertando 
(L(x)  *,  L(y)),  que  sera  necesariamente  el  primer  par  a  usar  pues  en  todos  los  dernas  una  cadena 
comenzara  con  *  y  la  otra  no.  Para  cada  (it,  v)  G  P  (incluyendo  (. x ,  y),  que  puede  usarse  nuevamente 
dentro),  insertamos  (R(u),L(v))  en  P' .  Para  poder  terminar  la  cadena,  insertamos  ($,*$)  en  P' . 
Los  snnbolos  *  y  $  no  estan  en  E.  Toda  solucion  de  P  comenzando  con  (x,y)  tendra  su  solucion 
equivalente  en  P' ,  y  viceversa.  □ 

El  siguiente  lema  puede  parecer  sorprendente,  pues  uno  esperarfa  poder  resolver  este 
problema  automaticamente. 
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Teorema  5.4  El  problema  de  correspondencia  modificado  de  Post  es  indecidible,  y  por  lo 
tanto  el  original  tambien  lo  es. 

Prueba:  Supongamos  que  queremos  saber  si  w  z  para  una  GDC  G  =  (V,  E,  R,  S)  y  cadenas 
w,  z  cualquiera,  con  la  restriction  de  que  u  — >  v  €  R  implica  v  ^  e.  Crearemos  un  sistema  de  Post 
modificado  que  tendra  solucion  sii  w  =^*G  z.  Como  esto  ultimo  es  indecidible  por  el  Lerna  5.11 
(donde  las  G  para  las  que  lo  demostramos  efectivamente  no  tienen  reglas  del  tipo  u  — >  s),  los 
sistemas  de  Post  son  indecidibles  en  general  tambien. 

En  este  sistema,  de  alfabeto  bUSU  {*},  tendremos  un  par  inicial  (x,y)  =  (*,*w*),  donde 
*  0  V  U  E.  Tendremos  asimismo  todos  los  pares  (a,  a),  a  £  V  U  E  U  {*},  y  tambien  los  (u,v), 
u  — >  v  €  R.  Finalmente,  tendremos  el  par  (2**,*). 

Es  facil  ver  que  existe  una  secuencia  de  derivaciones  que  lleva  de  w  a  z  sii  este  sistema  modificado 
tiene  solucion.  La  idea  es  que  comenzamos  con  w  abajo,  y  luego  la  “leemos”  calzandola  arriba  y 
copiandola  nuevamente  abajo,  hasta  el  punto  en  que  decidimos  aplicar  una  regia  u  — >  v.  A1 
terminar  de  leer  w,  hemos  creado  una  nueva  w'  abajo  donde  se  ha  aplicado  una  regia,  w  =>  w' . 
Si  terminamos  produciendo  z,  podremos  calzar  la  cadena  completa  del  sistema  de  Post.  □ 

Ejemplo  5.2  Supongamos  que  queremos  saber  si  S  aaabbb ,  donde  las  reglas  son  S  — >  aSb 

y  S  — >  ab.  El  sistema  de  Post  modificado  asociado  es 

P  =  {{*,*S*),  (a,  a),  ( b,  b ),  (*,*),  (S,aSb),  ( S,ab ),  (aaabbb**,*)} 

y  (x,y)  =  (*,*S*).  El  calce  que  Simula  la  derivacion,  escribiendo  los  pares  con  la  primera 
componente  arriba  y  la  segunda  abajo,  es 


* 

s 

* 

a 

S 

b 

* 

a 

a 

S 

b 

b 

* 

aaabbb *  * 

*s* 

aSb 

* 

a 

aSb 

b 

* 

a 

a 

ab 

b 

b 

* 

* 

donde,  por  ejemplo,  para  cuando  logramos  calzar  el  *S*  de  abajo  con  las  cadenas  de  arriba,  ya 
hemos  generado  aSb*  abajo  para  calzar.  Ilustra  ver  la  misma  concatenacion  de  fichas,  ahora 
alineando  las  secuencias. 

*|S'|*|a|S|6|*|a|a|S'|6|6|*|a  a  a  b  b  b  *  * 

*  S  *  |  a  S  b  |  *  |  a  |  a  S  b\b\*\a\a  \  a  b\b\b\*\* 

El  hecho  de  que  los  sistemas  de  Post  sean  indecidibles  nos  permite,  mediante  reducciones, 
demostrar  que  ciertos  problemas  sobre  GLCs  son  indecidibles. 

Teorema  5.5  Dadas  dos  GLCs  G\  y  G2,  es  indecidible  saber  si  C(G  1)  D  C(G2)  =  0  0  no. 

Prueba:  Podemos  reducir  la  solucion  de  un  sistema  de  Post  a  este  problema.  Sea  P  = 

{(iti,  v\),  (■ u2 ,  v2),  ■  ■  ■ ,  ( un ,  vn)}  nuestro  sistema,  sobre  un  alfabeto  E.  Definiremos  G\  =  ({5i},  E  U 
{c},RuSi),  con  c  0  E  y  R\  conteniendo  las  reglas  S 1  — >  ufS\Vi  \  ufcvi  para  1  <  i  <  n.  Por 
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otro  lado,  definiremos  G2  =  ({S'2},  E  U  {c},  R2l  S2),  con  R2  conteniendo  S2  — >  aS2a  para  todo 
a  €  E  y  S'2  — >  c.  Entonces  C(GR)  =  {ufn  . . .  u^u^cv^v^  . . .  vik,  k  >  0,  1  <  h,  i2, . .  ,  ,ik  <  n}  y 
jC(G2)  =  {wRcw,  w  G  E*}.  Esta  claro  que  P  tiene  solucion  sii  C(G\)  y  C(G2)  tienen  intersection. 
□ 


Otro  problema  importante  en  GLCs  es  determinar  si  una  G  es  ambigua  (Def.  3.7).  Este 
problema  tampoco  es  decidible. 

Teorema  5.6  Dada  una  GLC  G,  es  indecidible  saber  si  G  es  ambigua. 

Prueba:  Podemos  reducir  la  solucion  de  un  sistema  de  Post  a  este  problema.  Sea 

P  =  {(ui,ui),  (u2,v2), . . .  ,(un,vn)}  nuestro  sistema,  sobre  un  alfabeto  E.  Definiremos  G  = 
({5,  Si,  S'2},  S  U  {ai,  02, . . . ,  an},  R,  S),  con  a*  0  E  y  R  conteniendo  las  reglas  S  — X  Si  |  S2, 
S 1  — X  aiS\Ui  |  a{U{  para  cada  i,  y  S2  — >  aiS2Vi  \  a%vt  para  cada  i.  De  Si,  entonces,  se  generan 
todas  las  cadenas  de  la  forma  aik  . . .  al2ai1ullUi7  . .  .utk,  mientras  que  de  S2  se  generan  todas  las 
cadenas  de  la  forma  aik  . . .  al2ai1vllV{2  . . .  Vik.  Esta  claro  que  G  es  ambigua  sii  hay  una  forma  de 
generar  una  misma  cadena,  usando  los  mismos  pares,  mediante  las  u’s  y  mediante  las  u’s,  es  decir, 
si  P  tiene  solucion.  □ 

Finalmente,  volveremos  a  utilizar  MTs  para  demostrar  que  cl  siguiente  problema,  de 
encontrar  una  forma  de  embaldosar  un  piso  infinito  (o  resolver  un  rompecabezas),  no  tiene 
solucion  algoritmica. 

Definicion  5.9  Un  sistema  de  baldosas  es  una  tupla  (D,  d0,  H,  V),  donde  D  es  un  conjunto 
finito,  d0  G  D,  y  H,V  C  D  x  D.  Un  embaldosado  es  una  funcion  f  :  N  x  N  — »  D, 
que  asigna  baldosas  a  cada  celda  de  una  matriz  infmita  (pero  que  comienza  en  una  esquina), 
donde  f  (0,0)  =  d0,  y  para  todo  mpn  >  0,  (f(n,m),f(n+l,m))  G  V,  (f(n,m),f(n,m+ 1))  G 

H. 


La  idea  es  que  H  dice  que  baldosas  pueden  ponerse  a  la  derecha  de  que  otras,  mientras 
que  V  dice  que  baldosas  pueden  ponerse  arriba  de  que  otras. 

Teorema  5.7  El  problema  de,  dado  un  sistema  de  baldosas,  determinar  si  existe  un 
embaldosado,  es  indecidible. 

Prueba:  La  idea  es  definir  un  sistema  de  baldosas  a  partir  de  una  MT  M,  de  rnodo  que  M  se 
detenga  frente  a  la  cinta  vacfa  sii  no  existe  un  embaldosado.  La  fila  i  de  la  matriz  corresponded 
a  la  cinta  de  M  en  el  paso  i.  Las  baldosas  tienen  shnbolos  escritos  en  algunos  de  sus  lados,  y  las 
reglas  H  y  V  indican  que,  para  poner  una  baldosa  pegada  a  la  otra,  lo  que  tienen  escrito  en  los 
lados  que  se  tocan  debe  ser  igual. 

Las  celdas  de  la  primera  fila  son  especiales:  do  es  la  baldosa  de  la  izquierda,  y  las  demas  baldosas 
de  la  primera  fila  solo  podran  ser  escogidas  iguales  a  la  baldosa  de  la  derecha. 
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(s,#) 

# 

# 

#  # 

d0 

El  lado  superior  (s,  #)  indica,  ademas  del  caracter  en  la  cinta,  que  el  cabezal  esta  en  esa  celda 
y  el  estado.  Las  celdas  que  estan  lejos  del  cabezal  no  cambian  entre  el  paso  i  e  i  +  1.  Para  esto 
existen  baldosas 


a 


a 


para  cada  a  €  S.  Para  poner  la  baldosa  que  va  arriba  de  la  del  cabezal,  las  reglas  dependeran 
del  5  de  M.  Si  5(q,  a)  =  (p,  b )  con  b  £  E,  tendremos  una  baldosa  que  nos  permita  continual-  hacia 
arriba  a  partir  de  una  baldosa  rotulada  (q,  a )  en  el  borde  superior: 


(P,b) 

(q,a) 


En  cambio,  si  S(q,  a)  =  (p.  <),  necesitamos  baldosas  que  nos  permitan  indicar  que  el  cabezal  se 
ha  movido  hacia  la  izquierda: 


a 

(P,b) 

(P,<) 

(P,<) 

(q,a) 

b 

para  cada  b  G  E,  y  similarmente  para  el  caso  6(q,  a)  =  (p,  >): 
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a 

(P,b) 

(P>>) 

(P>>) 

(q,a) 

b 

Es  facil  ver  que,  si  M  se  detiene  frente  a  la  cinta  vacia,  entonces  llegaremos  en  algun  paso  i  a 
una  celda  con  el  borde  superior  rotulado  (h,  b)  para  algrin  b  G  S.  Como  no  existe  regia  para  poner 
ninguna  baldosa  sobre  esta,  sera  imposible  encontrar  un  embaldosado  para  este  sistema.  Si,  en 
carnbio,  M  corre  para  siempre,  sera  posible  embaldosar  toda  la  rnatriz  infinita. 


Notar  que,  si  M  se  cuelga,  el  cabezal  simplemente  desaparecer  de  nuestra  simulacin,  y  ser 
posible  embaldosar  el  piso  porque  no  ocurrirn  ms  cambios  en  la  cinta.  Esto  es  correcto  porque  la 
mquina  no  se  ha  detenido  (sino  que  se  ha  colgado).  □ 


Ejemplo  5.3  Supongamos  una  MT  M  con  las  reglas  5(s,#)  =  ( q,a ),  S(q,a )  =  (p,  D>),  S(p ,#)  = 
( p,a ),  5(p,a )  =  (h,>).  El  embaldosado  correspondiente  a  esta  MT  es  el  siguiente,  donde  queda 
claro  que  no  se  puede  embaldosar  el  piano  inhnito: 
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Terminaremos  este  capitulo  ilustrando  la  jerarquia  de  lenguajes  que  hemos  obtenido. 
Esta  se  refinara  en  cl  proximo  capitulo. 


No  aceptables 
Aceptables 
Decidibles 


5.5  Ejercicios 

1.  Un  automata  finito  universal  es  un  automata  finito  que  recibe  como  entrada  la 
codification  de  un  automata  finito  y  la  de  una  cadena  de  entrada,  es  decir  p(M)p(w),  y 
se  comporta  sobre  p(w)  igual  que  como  lo  haria  M.  Explique  por  que  no  pnede  exist  ir 
un  automata  finito  universal. 

2.  Mnestre  que  la  union  y  la  intersection  de  lenguajes  Turing-aceptables  es  Turing- 
aceptable  (aunque  no  el  complcmento,  como  virnos). 

3.  Mnestre  qne  la  union,  intersection,  complemento,  concatenation  y  clausura  de  Kleene 
de  lenguajes  Turing-decidibles  es  Turing-decidiblc. 

4.  Muestre  que  cualquier  conjunto  finito  es  Turing-decidiblc. 

5.  Mnestre  qne  L  es  Turing-aceptable  si  y  solo  si,  para  alguna  MTND  M,  L  =  {w  E 

£*,  ( s ,  #)  \~*M  (. h ,  donde  s  es  el  estado  initial  de  M. 
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6.  Sea  E  un  alfabeto  que  no  contiene  la  letra  c.  Suponga  que  L  C  {w\CW2,  wi,W2  G  E*} 
es  Turing-aceptable.  Muestre  que  L'  =  {uq,  3 w2,  wqcuq  G  L}  es  Turing-aceptable.  Si 
L  es  decidiblc,  ^necesariamente  L'  es  decidible? 

7.  Suponga  que,  para  ahorrar  espacio,  quiere  construir  un  algoritmo  que  minimice 
maquinas  de  Turing:  dada  una  MT  M,  genera  otra  que  acepta  cl  mismo  lenguaje  pero 
tiene  el  menor  numero  posible  de  estados.  Dentro  de  las  que  tienen  el  menor  numero 
de  estados,  devuelve  la  que  genera,  lexicograficamente,  la  menor  representation  p(M'). 
Muestre  que  tal  algoritmo  no  puede  existir. 

8.  ^Cuales  de  los  siguientes  problemas  problemas  se  pueden  resolver  por  algoritmo  y  cuales 
no?  Explique. 

(a)  Dadas  M  y  w ,  determinar  si  M  alguna  vez  alcanza  el  estado  q  al  ser  arrancada 
sobre  w  a  partir  del  estado  s. 

(b)  Dadas  M,  w  y  un  shnbolo  a  G  E,  determinar  si  M  alguna  vez  escribe  el  snnbolo 
a  en  la  cinta,  al  ser  arrancada  sobre  w  a  partir  del  estado  s. 

(c)  Dadas  M\  y  M2,  determinar  si  hay  una  cadena  w  en  la  cual  ambas  se  detienen. 

(d)  Dada  M,  determinar  si  alguna  vez  mueve  cl  cabezal  hacia  la  izquierda,  arrancada 
en  el  estado  s  sobre  la  cinta  vacia. 

(e)  Dada  M,  determinar  si  alguna  vez  llegara  a  una  cierta  position  n  de  la  cinta. 

5.6  Preguntas  de  Controles 

A  continuacion  se  muestran  algunos  ejercicios  de  controles  de  anos  pasados,  para  dar  una 
idea  de  lo  que  se  puede  esperar  en  los  proximos.  Hemos  omitido  (i)  (casi)  repeticiones,  (ii) 
cosas  que  ahora  no  se  ven,  (in)  cosas  que  ahora  se  dan  como  parte  de  la  materia  y/o  estan 
en  los  ejercicios  anteriores.  Por  lo  mismo  a  veces  los  ejercicios  se  han  alterado  un  poco  o  se 
presenta  solo  parte  de  ellos,  o  se  mezclan  versiones  de  ejercicios  de  distintos  anos  para  que 
no  sea  repet  it  ivo. 

C2  1996  Responda  verdadero  o  falso  y  justifique  brevemente  (maximo  5  lineas).  Una 
respuesta  sin  jusitificacion  no  vale  nada  aunque  este  correcta,  una  respuesta  incorrecta 
puede  tener  algun  valor  por  la  justificacion. 

a)  Si  se  pudiera  resolver  cl  problema  de  la  detention,  todo  lenguaje  aceptable  seria 
decidible. 

b )  Si  se  pudiera  resolver  cl  problema  de  la  detention,  todos  los  lenguajes  serian 
decidibles. 

c)  Hay  lenguajes  que  no  son  aceptables  y  su  complemento  tampoco  lo  es. 
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d)  Dada  una  MT,  hay  un  algoritmo  para  saber  si  es  equivalente  a  un  automata  finito 
(en  terminos  del  lenguaje  que  acepta). 

e)  Si  una  MT  se  pudiera  mover  solamente  hacia  adelante  y  no  escribir,  solo  podria 
aceptar  lenguajes  regulares. 

C2  1996  Se  tiene  una  funcion  biyectiva  y  Turing-computable  /  :  E*  — *  E*. 

Demuestre  que  la  inversa  /_1  :  E*  — >  E*  tambien  es  Turing-computable.  La 
demostracion  debe  ser  precisa  y  suficicntemente  detallada  para  que  no  queden  dudas 
de  su  validez. 

C2  1997  Sea  M  una  maquina  que  recibe  una  cadena  w  y  arranca  la  Maquina  Universal  de 
Turing  (MUT)  con  la  entrada  wp[w).  Se  pregunta  si  M  acepta  la  cadena  p(M). 

a)  Identifique,  del  material  que  hemos  visto,  que  lenguaje  acepta  M. 

b )  A  partir  de  la  definition  del  lenguaje  que  acepta  M,  ^puede  deducir  la  respuesta  a 

la  pregunta?  Comente. 

c)  Considere  la  maquina  operacionalmente  y  lo  que  hara  la  MLIT  cuando  reciba  su 

entrada  y  empiece  a  procesarla.  ^Puede  responder  ahora  la  pregunta?  /,La 
respuesta  acarrea  alguna  contradiction  con  b)l  Explique. 

C2  1997  Sea  /  una  funcion  de  E*  en  E*,  tal  que  $  ^  E. 

•  Demuestre  que  si  cl  lenguaje  L  =  {u  $  f(u),  u  G  E*}  es  decidible,  entonces  /  es 
computable. 

•  Demuestre  que  si  L  es  aceptable,  /  sigue  siendo  computable. 

ExRec  1997  Lin  oraculo  es  un  mecanismo  (no  necesariamente  posible  de  construiT)  capaz 
de  responder  alguna  pregunta  indecidible. 

Suponga  que  tiene  un  oraculo  capaz  de  decidir  el  problema  de  la  detention,  y  lo 
considera  como  un  mecanismo  utilizable  (es  decir,  el  problema  se  hace  de  repente 
decidible).  Responda  justificando  brevemente  (maximo  5  lineas). 

a)  ^Todos  los  lenguajes  aceptables  pasarfan  ahora  a  ser  decidibles?  ^Quedarian 
lenguajes  no  decidibles?  ^Quedarian  lenguajes  no  aceptables? 

b )  Las  mismas  preguntas  anteriores  si  dispusiera  (a  su  election)  de  una  cantidad 
numerable  de  los  oraculos  que  necesite. 

c)  Las  mismas  anteriores  si  la  cantidad  de  oraculos  pudiera  ser  no  numerable. 
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Ex  1998  Considere  una  MT  que  calcula  funciones  a  la  cual,  frente  a  la  entrada  w,  se  lc 
permite  realizar  a  lo  sumo  f(\w\)  pasos,  donde  /  es  una  funcion  fija  para  la  MT.  Si 
para  ese  momento  no  termino  se  supone  que  su  respuesta  es,  digamos,  la  cadena  vacia. 

Pruebe  que  con  este  tipo  de  maquinas  no  se  pueden  calcular  todas  las  funciones  Turing- 
computables. 

Ex  1999  Dibuje  un  diagrama  de  conjuntos  para  indicar  las  relaciones  de  inclusion  e 
intersection  de  las  siguientes  clases  de  lenguajes:  regulares  (R),  libres  del  contexto 
(LC),  todos  los  complementos  de  L  (CLC),  recursivos  (C),  recursivos  enumerables 
(RE)  y  todos  los  complementos  de  RE  (CRE).  Justifique  brevemente. 

Cl  2001  Un  automata  de  dos  pilas  permite  operar  sobre  arnbas  pilas  a  la  vez,  y  acepta  una 
cadena  cuando  llega  a  un  estado  final,  sin  importar  el  contenido  de  las  pilas. 

(a)  Defina  formalmente  este  automata,  la  notion  de  configuration,  la  forma  en  que  se 
pasa  de  una  configuration  a  la  siguiente,  y  el  lcnguaje  que  acepta. 

(b)  Demuestre  que  los  lenguajes  aceptados  por  un  automata  de  dos  pilas  son 
exactamente  los  lenguajes  Turing-aceptables. 

C2  2002  Sea  Mi  la  MT  que  acepta  cl  lenguaje  K\,  mediante  convertir  la  entrada  p(M )  en 
p{M)p{p{M))  e  invocar  la  MLIT. 

(a)  Determine  si  p(Mi )  G  Afi  o  no.  Explique  su  respuesta. 

(■ b )  Cualquiera  haya  sido  su  respuesta  a  la  pregunta  anterior,  ^es  posible  redisenar  M\ 
para  que  la  respuesta  cambie,  y  siga  siendo  valido  que  Mi  acepta  Afi? 

Considere  la  MGT  del  [Ex  2002]  (pagina  110). 

^Puede  hacer  una  MT  que  acepte  £(MGT)C?  Explique  como  o  demuestre  que  no 
puede. 

^Puede  hacer  una  MT  que  decida  si  w  G  A(G)?  Explique  como  o  demuestre  que 
no  puede. 

Vuelva  a  responder  la  pregunta  anterior  suponiendo  ahora  que  G  es  una  gramatica 
fibre  del  contexto. 

Ex  2003,  C2  2008  Argumente  de  la  forma  mas  clara  posible,  sin  exceder  las  5  lineas,  por 
que  los  siguientes  problemas  son  o  no  son  computables. 

(a)  Dado  un  programa  en  C,  determinar  si  es  posible  que  una  determinada  variable  se 
examine  antes  de  que  se  le  asigne  un  valor. 


Ex  2002 
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( b )  Dado  un  programa  en  C,  determinar  si  es  posiblc  llcgar  a  una  determinada  linea 

del  codigo  sin  antes  haber  ejecutado  una  determinada  funcion. 

(c)  Dado  un  programa  en  C,  determinar  si  es  posible  que  termine  antes  de  haber 

pasado  mas  de  una  vez  por  alguna  linea  del  programa  (considere  que  se  escribe  a 
lo  sumo  un  comando  por  linea). 

Se  unieron  preguntas  similares  de  esos  anos. 

C2  2004  Se  define  la  distancia  de  edition  generalizada  de  la  siguiente  forma.  Se  da  un 
conjunto  finito  de  sustituciones  permitidas  (a,/3,c),  con  a^/3GE*ycG  M+ 
cl  costo  de  la  sustitucion.  Dada  una  cadena  x,  se  le  pueden  aplicar  repetidamente 
transformaciones  de  la  forma:  buscar  un  substring  a  y  reemplazarlo  por  fd.  El  costo  de 
una  serie  de  transformaciones  es  la  surna  de  los  costos  individuales.  Dadas  dos  cadenas 
x  e  y,  la  distancia  de  edition  generalizada  de  x  a  y  es  cl  minimo  costo  de  transformar 
x  en  y ,  si  esto  es  posible,  e  infinito  sino. 

Demuestre  que  la  distancia  de  edition  generalizada  no  es  computable. 

Ex  2004 

(a)  Demuestre  que  el  problema  de,  dada  una  MT  M,  una  entrada  w,  y  un  numero  k, 
saber  si  M  llega  a  la  fc-esima  celda  de  la  cinta  frente  a  la  entrada  w,  es  decidible. 

(b)  Demuestre  que  el  problema  de,  dada  una  MT  M  y  una  entrada  w,  saber  si  llega 
a  la  fc-esima  celda  para  todo  k  (es  decir,  no  usa  una  portion  finita  de  la  cinta), 
no  es  decidible. 

(c)  Un  lcnguaje  es  sensitivo  al  contexto  si  es  generado  por  una  gramatica  dependiente 
del  contexto  donde  toda  regia  u  — >  v  cumple  |u|  <  |u|  (por  ejemplo,  {anbncn,  n  > 
0}  es  sensitivo  al  contexto).  Demuestre  que  los  lcnguajes  sensitivos  al  contexto 
son  Turing-decidibles. 

Ex  2005  De  los  siguientes  productos  ofrecidos  por  la  empresa  MediocreProducts,  indique 
cuales  podrian,  al  rnenos  en  principio,  funcionar  de  acuerdo  a  la  description  que  se 
entrega,  y  cuales  no.  Argumente  brevemente. 

MediocreD ebug !:  Recibe  como  entrada  cl  texto  de  un  programa  en  Pascal  e  indica 
la  presencia  de  loops  o  recursiones  que,  para  alguna  entrada  al  programa  Pascal, 
no  tcrminan. 

MediocreRegular !:  Un  sencillo  lenguaje  de  programacion  pensado  para  producir 
parsers  de  lcnguajes  regulares.  Permite  variables  globales  escalares  (no  arreglos 
ni  punteros),  sin  recursion.  Hay  un  buffer  de  1  caracter  para  leer  la  entrada, 
en  la  que  no  se  puede  retroceder.  El  software  es  un  compilador  que  recibe 
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como  entrada  un  programa  escrito  en  MediocreRegular!,  lo  compila  y  produce  un 
ejecutable  que  parsea  un  determinado  lenguaje  regular.  jCon  MediocreRegular! 
usted  podra  parsear  cualquier  lenguaje  regular! 

Mediocre ContextFree !:  Un  maravilloso  lenguaje  de  programacion  pensado  para 
producir  parsers  de  lenguajes  libres  del  contexto.  Permite  variables  globales 
escalares  (no  arreglos  ni  punteros),  sin  recursion.  Se  usa  de  la  misma  forma  que 
MediocreRegular! ',  jy  le  permitira  parsear  cualquier  lenguaje  libre  del  contexto! 

Mediocre  ContextFree!  ( Professional ):  Un  completo  lenguaje  de  programacion 
para  iniciados,  con  el  mismo  objetivo  y  forma  de  uso  que  MediocreContextFree!. 
El  lenguaje  ahora  permite  variables  locales  y  recursion.  Usted  podra  parsear 
cualquier  lenguaje  libre  del  contexto,  con  mas  herramientas  que 

Mediocre  ContextFree! 

MediocreTuring !:  Un  editor  grafico  de  Maquinas  de  Turing,  que  incluye  una 
herramienta  simplificadora  de  maquinas.  jUsted  disena  su  maquina  y 

MediocreTuring!  se  la  simplifica  hast  a  obtener  la  menor  maquina  posible  que 
acepta  cl  mismo  lenguaje  que  la  que  usted  diseno! 

C2  2006  Demuestre  que  el  problema  de,  dadas  dos  Maquinas  de  Turing  Mi  y  M2  que 
computan  funciones  fi  y  f2  de  Eg  en  E*,  determinar  si  f\  =  /2  es  indecidible. 

Ayuda:  considere  la  funcion  /m(w$J")  =  S  si  M  se  detiene  frente  a  w  en  a  lo  sumo  n 
pasos,  y  N  en  otro  caso. 

C2  2006  Demuestre  que  la  union  e  intersection  de  lenguajes  Turing-aceptables  es  Turing- 
aceptable,  pero  no  la  diferencia. 

Ex  2006  Harta  de  recibir  crfticas  por  que  sus  programas  se  cuelgan,  la  empresa 
MediocreProducts  decide  cambiar  de  lenguaje  de  programacion  para  que  sea  imposible 
que  tal  cosa  ocurra.  En  este  nuevo  lenguaje  existen  dos  instrucciones  de  salto.  Una  es 
el  if-then-else  de  siempre,  y  la  otra  es  un  while  restringido:  while  (expr\  )  do  sent 
max  ( expr2 )  ejecutara  sent  mientras  expri  ^  o,  pero  a  lo  sumo  expr2  veces.  Si  luego 
de  expr-2  iteraciones  el  while  no  ha  terminado,  cl  programa  aborta  dando  un  error 
(pero  no  se  queda  pegado  jamas).  Esta  expr2  debe  evaluar  a  un  entero  positivo,  y  no 
se  vuelve  a  evaluar  luego  de  cada  iteration,  sino  solo  al  comienzo  del  while. 

Comente  sobre  el  futuro  de  MediocreProducts  cuando  sus  programadores  sean 
obligados  a  usar  este  lenguaje. 

C2  2007  Un  automata  linealmente  acotado  (ALA)  es  parecido  a  una  MT,  excepto  porque 
solo  debe  trabajar  dentro  de  las  ccldas  en  que  vino  originalmente  la  entrada,  sin 
posibilidad  de  extenderse  a  las  celdas  blancas  de  la  derecha. 

1.  Muestre  que  puede  reconocer  L  =  {anbncn,  n  >  1}  con  un  ALA. 
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2.  Muestre  que  cl  problema  de  la  detention  tiene  solution  para  este  tipo  de 
automatas. 

3.  ^Los  ALAs  son  equivalentes  en  poder  a  las  MTs?  Argumente. 

C2  2008  Considere  un  modclo  de  computation  donde,  si  la  MT  se  arranca  sobre  una  entrada 
w,  el  espacio  de  cinta  que  tiene  disponible  para  calcular  es  de  f(\w\)  celdas,  donde 
f(n)  >  n  +  2  es  alguna  funcion  conocida.  Si  la  MT  trata  de  acceder  ms  alia  en  la  cinta, 
se  cuelga. 

1.  Demuestre  que,  conociendo  /,  el  problema  de  la  detention  es  decidible  en  este 
modelo. 

2.  ^Habra  una  cierta  /  suficientemente  generosa  para  la  cual  se  puedan  calcular 
todas  las  funciones  computables  en  el  modelo  clasico? 

Ex  2008  Un  2-AFD  es  un  automata  finito  determim'stico  que  tiene  dos  cabezales 
bidireccionales  de  solo  lectura.  Los  cabezales  empiezan  en  el  lado  izquierdo  de  la  cinta 
de  entrada  y  pueden  moverse  a  cualquier  direction  independientemente.  La  cinta  de  un 
2-AFD  es  finita  y  su  tamano  es  igual  al  largo  de  la  entrada  mas  dos  celdas  adicionales 
que  almacenan  delimitadores  como  el  bianco  de  una  MT.  Lin  2-AFD  acepta  su  entrada 
si  entra  a  un  estado  especial  de  aceptacion. 

1.  Defina  formalmente  el  2-AFD  como  una  tupla  de  componentes;  luego  defina  lo  que 
es  una  configuration;  como  es  una  transition  entre  configuraciones;  el  concepto  de 
aceptar  o  no  una  cadena;  y  finalmente  defina  el  lenguaje  aceptado  por  un  2-AFD. 

2.  Aunque  cl  problema  de  la  detention  en  este  modelo  es  decidibe  demuestre  que  el 
lenguaje  E  =  {(A)|A  es  un  2-AFD  y  L(A)  =  0}  es  no  decidible. 


5.7  Proyectos 

1.  Investigue  sobre  funciones  recursivas  primitivas  y  /i-recursivas  como  modelo  alternative 
de  computation,  esta  vez  con  enfasis  en  cl  tenia  dc  la  termination.  Lina  fuente  es  [LP81, 
sec.  5.3  a  5.6]. 

2.  Investigue  sobre  otras  preguntas  indecidibles  sobre  GLCs.  Lina  fuente  es  [Kcl95, 
pag.  261  a  263],  otra  es  [HMU01,  sec.  9.5.2  a  9.5.4], 

3.  Investigue  sobre  oraculos  y  grados  de  indecidibilidad.  Lina  fuente  es  [DW83,  cap.  5]. 

4.  Investigue  sobre  la  complejidad  de  Kolmogorov  y  su  relation  con  la  computabilidad. 
Lina  fuente  es  [LV93]. 

5.  Lea  otros  libros  mas  de  divulgation,  pero  muy  entretenidos,  sobre  computabilidad,  por 
ejemplo  [Hof99]  o  [PG02],  ^Es  algoritmico  nuestro  pensamiento? 
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[LP81,  cap  7],  [AHU74,  cap  10  y  11] 

En  este  capitulo  nos  preocuparemos  por  primera  vez  del  tiempo  que  demora  una  MT  en 
calcular  una  funcion  o  decidir  un  lenguaje.  Todos  los  problemas  que  consideraremos  seran 
decidibles,  pero  trataremos  de  distinguir,  dentro  de  ellos,  cuales  son  mas  “faciles”  que  otros. 

Nuevamente  identificaremos  decidir  lenguajes  (saber  si  una  cadena  esta  en  un  conjunto) 
con  resolver  problemas  de  decision,  es  decir  responder  si  o  no  frente  a  una  entrada. 

6.1  Tiempo  de  Computacion  [lpsi,  sec  7.1] 

Comenzaremos  definiendo  el  tiempo  de  una  computacion  basandonos  en  cl  numero  de 
pasos  que  realiza  una  MT. 

Definicion  6.1  Una  computacion  de  n  pasos  de  una  MT  M  es  una  secuencia  de 
configuraciones  C0  \~M  C\  \~M  C2  ■  ■  ■  \~M  Cn.  Diremos  que  C0  lleva  en  n  pasos  a  Cn  y 
lo  denotaremos  Co  Cn . 

Definicion  6.2  Diremos  que  M  =  (K,  E,<5,  s)  calcula  f(w )  en  n  pasos  si  (s,]]w]f)  \-nM 
(h,#f(w)±). 

Dada  una  MT  M  que  calcula  una  cierta  funcion  /,  queremos  dar  una  nocion  de  cuanto 
tiempo  le  torna  a  M  calcular  /.  Decir  cuanto  demora  para  cada  entrada  w  posible  da  mas 
detalle  del  que  nos  interesa.  Lo  que  quisieramos  es  dar  el  tiempo  en  funcion  del  largo  de 
la  entrada.  Un  problema  es  que  distintas  entradas  del  mismo  largo  pueden  requerir  una 
cantidad  de  pasos  distinta.  Lo  que  usaremos  sera  la  nocion  de  peor  caso  de  algoritmos:  nos 
interesara  el  mayor  tiempo  posible  dentro  de  las  entradas  de  un  cierto  largo. 

Definicion  6.3  Diremos  que  M  computa  /  :  Eg  — >  EJ  en  tiempo  T(n)  si,  para  cada 
w  e  Eq7  M  calcula  f(w)  en  a  lo  sumo  T(|w|)  pasos.  Similarmente,  diremos  que  M  decide 
L  en  tiempo  T(n)  si  M  calcula  ]'l  en  tiempo  T(n )  (ver  Def.  4-7). 
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Es  interesante  que  hay  un  nrinimo  de  pasos  en  cl  que  se  puede  decidir  un  lenguaje. 

Lema  6.1  No  es  posible  decidir  un  lenguaje  en  tiempo  menor  a  T(n)  =  2n  +  4. 

Prueba:  Solo  para  retroceder  desde  la  configuration  jfwjf  borrando  la  entrada  hasta  detectar  el 
comienzo  de  la  cinta  se  necesitan  2n  +  1  pasos.  Luego  se  necesitan  a  lo  menos  3  pasos  mas  para 
escribir  S  o  N  y  posicionarse  en  la  siguiente  celda.  □ 

Ejemplo  6.1  Una  MT  que  decide  L  =  {w  £  {a,  b}*,  w  tiene  una  cantidad  impar  de  b's  }  (recordar 
Ej.  2.7)  puede  ser  como  sigue  (en  notation  no  modular). 

b,# 

b,# 


Es  facil  ver  que  esta  MT  requiere  siempre  2n  +  4  pasos  para  una  entrada  de  largo  n. 

Observation  6.1  Es  facil  darse  cuenta  de  que  cualquier  lenguaje  regular  se  puede  decidir 
en  tiempo  2 n  +  4,  mediante  modificar  sistematicamente  el  AFD  que  lo  reconoce  para  que 
lea  la  cadena  al  reves,  la  vaya  borrando,  y  luego  escriba  S  o  N  segun  haya  quedado  en  un 
estado  final  o  no.  $Que  pasa  con  los  libres  del  contexto?  Por  otro  lado,  si  es  posible  calcular 
funciones  mas  rapidamente:  la  funcion  identidad  se  calcula  en  un  solo  paso. 

Ejemplo  6.2  Bastante  mas  complicado  es  calcular  el  tiempo  que  tarda  la  MT  del  Ej.  4.10  en 
decidir  su  lenguaje.  Un  analisis  cuidadoso  muestra  que,  si  w  €  L,  el  tiempo  es  n2/2  +  13n/2,  donde 
n  =  |u)|,  pero  puede  ser  bastante  menor  (hasta  2 n  +  6)  si  w  0  L. 

En  general,  determinar  la  funcion  exacta  T(n)  para  una  MT  puede  ser  bastante  dificil  ,De 
hecho  no  es  computable  siquiera  saber  si  terminara!.  Veremos  a  continuation  que,  afortunadamente, 
es  irrelevante  conocer  tanto  detalle. 


6.2.  MODELOS  DE  COMPUTACION  Y  TIEMPOS 
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6.2  Modelos  de  Computacion  y  Tiempos  [lpsi,  sec  7.3] 

Hasta  ahora  nos  hemos  mantenido  en  el  modelo  de  MTs  determinfsticas  de  una  cinta. 
Veremos  a  continuation  que  los  tiempos  que  obtenemos  son  bastante  distintos  si  cambiamos 
levemente  el  modelo  de  computacion.  Esto  nos  hara  cuestionarnos  cual  es  el  modelo  que 
realmente  nos  interesa,  o  si  podemos  obtener  resultados  suficientemente  generates  como  para 
que  estas  diferencias  no  importen.  De  aqm  en  adelante  necesitaremos  usar  la  notation  O. 

Definition  6.4  Se  dice  que  f(n )  es  0(g(n)),  para  f  y  g  crecientes,  si  existen  constantes 
c,  no  >  0  tal  que,  para  todo  n  >  no,  f(n)  <  c  ■  g(n). 

Esto  nos  pcrmite  expresar  comodamente,  por  ejemplo,  que  el  tiernpo  que  toma  una 
funcion  es  alguna  constante  multiplicada  por  n2,  diciendo  que  cl  tiernpo  es  0(n2).  Asimismo 
nos  permite  eliminar  detallc  innecesario,  pues  por  ejemplo  n2  +  2n  —  3  =  0(n2). 

Volvamos  ahora  al  tenia  de  la  dependencia  del  modelo  de  computacion. 

Ejemplo  6.3  Recordemos  la  MT  del  Ej.  4.7,  que  calculaba  f(w)  =  wwR.  Si  se  analiza 
cuidadosamente  se  vera  que  esa  MT  demora  tiernpo  T(n)  =  2 n2  +  4n.  Consideremos  ahora  la 
siguiente  MT  de  2  cintas. 


Analizandola,  resulta  que  su  T(n )  =  5n  +  3.  Por  otro  lado,  se  puede  demostrar  que  es  imposible 
obtener  un  T(n)  subcuadratico  usando  una  sola  cinta. 

Esto  signihca  que,  segun  cl  modelo  de  MT  que  usemos,  el  tiernpo  necesario  para  calcular 
una  funcion  puede  variar  mucho.  Lo  unico  que  podemos  garantizar  acerca  de  la  relacion 
entre  MTs  de  1  y  de  k  cintas  es  lo  siguiente. 

Lema  6.2  Sea  una  MT  M  de  k  cintas  que  requiere  tiernpo  T{n )  >  n  para  calcular  una 
funcion  f.  Entonces,  existe  una  MT  de  una  cinta  que  calcula  f  en  tiernpo  0(T(n)2). 
Prueba:  Nos  basamos  en  una  variante  de  la  simulacion  de  MTs  de  k  cintas  vista  en  la  Seccion  4.4. 
Esta  variante  es  mas  compleja:  en  vez  de  hacer  una  pasada  buscando  cada  cabezal,  hace  una  unica 
pasada  recolectando  los  caracteres  bajo  los  cabezales  a  medida  que  los  va  encontrando.  Luego 
vuelve  aplicando  las  transformaciones  a  la  cinta.  En  tiernpo  T{n)  la  MT  de  k  cintas  no  puede 
alterar  mas  de  n  +  T(n)  <  2 T(n)  celdas  de  la  cinta,  de  rnodo  que  la  simulacion  de  cada  uno  de 
los  T(n )  pasos  nos  puede  costar  un  recorrido  sobre  2 T{n)  celdas.  El  costo  total  es  de  la  forma 
0(T(n)2).  En  [LP81,  sec  7.3]  puede  verse  la  formula  exacta.  □ 
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Si,  por  ejemplo,  usamos  una  MT  de  cinta  doblemente  infinita,  la  podemos  simular  en 
tiempo  6 T(ri)  +  3n  +  8.  Si  usamos  una  MT  de  cinta  bidimensional,  la  podemos  simular  en 
tiempo  0(T(n)3).  Una  simulation  particularmente  importante  es  la  siguiente. 

Lema  6.3  Sea  una  maquina  RAM  que  requiere  tiempo  T(n)  para  calcular  una  funcion  f . 
Entonces,  existe  una  MT  de  una  cinta  que  calcula  f  en  tiempo  0(T(n)2). 

Prueba:  Nos  basamos  en  una  variante  de  la  simulacion  de  maquinas  RAM  de  la  Seccion  4.7.  Esa 
simulacion  usaba  2  cintas.  Hacerlo  con  una  cinta  es  un  poco  mas  engorroso  pero  posible  y  no  afecta 
el  tiempo  cuadratico  que  obtendremos.  Nuevamente,  la  maquina  RAM  no  puede  escribir  mas  de 
T(n)  celdas  distintas  en  tiempo  T(n),  y  por  ello  la  busqueda  de  las  celdas  secuencialmente  en  la 
cinta  1  no  puede  demorar  mas  de  0(T(n)).  Sumado  sobre  todas  las  T(n)  instrucciones  a  simular, 
tenemos  O  (T  (n)2) .  Es  cierto  que  las  celdas  representadas  en  la  MT  pueden  tener  largo  variable,  pero  si  las 
representamos  en  binario  en  vez  de  unario  el  total  de  bits  necesario  sera  similar  al  de  las  maquinas  RAM, 
a  las  que  por  otro  lado  es  usual  cobrarles  tiempo  proporcional  a  la  cantidad  de  bits  que  manipulan.  □ 

Si  queremos  establecer  resultados  suficientemente  generales  como  para  que  se  apliquen 
a  otros  modelos  de  computation  razonables  (en  particular  las  maquinas  RAM),  no  debera 
importarnos  mucho  la  diferencia  entre  n2  y  n4.  Esto  parece  bastante  decepcionante,  pero  no 
deberfa.  Un  resultado  que  obtengamos  en  un  rnodelo  tan  permisivo  sera  muy  fuerte  y  muy 
general,  y  de  hecho  obtendremos  resultados  que  se  podran  trasladar  directamente  al  rnodelo 
RAM. 

Existe  un  rnodelo  que  homos  dejado  de  lado:  las  MTNDs.  Hay  dos  buenas  razones  para 
ello.  Una  es  que,  a  diferencia  de  los  modelos  anteriores,  no  sabemos  como  construir  MTNDs 
reales.  Otra  es  que  es  mucho  mas  costoso  simular  una  MTND  con  una  MTD.  Esta  diferencia 
es  central  en  la  teorfa  de  complejidad  computational. 

Las  MTNDs  no  calculan  funciones,  solo  aceptan  lenguajes,  por  lo  que  requieren  una 
definition  adecuada. 

Definition  6.5  Una  MTND  M  =  (K,E,A,s)  acepta  un  lenguaje  L  en  tiempo  T(n)  si, 
para  toda  w  e  (E  —  {#})*,  M  se  detiene  frente  a  w  en  a  lo  sumo  T(\w\)  pasos  sii  w  £  L. 

Observation  6.2  Recordemos  que  seguimos  dentro  de  los  lenguajes  decidibles,  y  hemos 
tenido  que  hablar  de  aceptar  por  un  tecnicismo.  Si  una  MTND  M  acepta  L  en  tiempo 
T(n),  para  cualquier  T(n),  entonces  L  es  decidible:  Basta  correr  M  durante  T(|w|)  pasos. 
Si  para  entonces  no  se  detuvo,  w  jL  L. 

Lema  6.4  Sea  M  una  MTND  que  acepta  L  en  tiempo  T(n).  Entonces  existe  una  MTD  que 
decide  L  en  tiempo  cT^n\  para  alguna  constante  c. 

Prueba:  Consideremos  una  variante  de  la  simulacion  vista  en  la  Seccion  4.5,  que  limpie  la  cinta 
y  responda  S  si  la  MTND  se  detiene  antes  de  la  profundidad  T(n)  +  1  en  el  arbol,  o  limpie  la 
cinta  y  responda  N  si  llega  a  la  profundidad  T(n)  +  1  sin  detenerse.  Esta  simulacion  tiene  un  costo 
exponential  en  T(n),  donde  la  base  depende  de  la  aridad  del  arbol.  □ 
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6.3  Las  Clases  V  y  AfV  [lpsi,  sec  7.4  y  7.5] 

La  section  anterior  nos  muestra  qne,  dentro  de  los  modelos  de  computacion  razonables 
(qne  exclnyen  las  MTNDs),  los  tiempos  de  computo  estan  relacionados  polinomialmente. 
Para  obtener  resultados  suficientemente  generates,  definiremos  una  clase  de  problemas 
“faciles”  y  otro  de  “dificiles”  qne  abstraiga  del  modelo  de  computacion. 

Definicion  6.6  La  clase  V  es  el  conjunto  de  todos  los  lenguajes  que  pueden  decidirse  en 
tiempo  polinomial  con  alguna  MTD  (es  decir,  T(n )  es  algun  polinomio  en  n).  La  clase  AfV 
es  el  conjunto  de  todos  los  lenguajes  que  pueden  aceptarse  en  tiempo  polinomial  con  alguna 
MTND. 

Lin  lenguaje  en  V  se  puede  resolver  en  tiempo  polinomial  usando  MTs  de  una  cinta,  k 
cintas,  cintas  bidimensionales,  maquinas  RAM,  etc.  Lin  lenguaje  en  AfV  puede  resolverse  en 
tiempo  polinomial  usando  MTNDs.  En  cierto  sentido,  V  represent  a  la  clase  de  problemas 
que  se  pueden  resolver  en  tiempo  razonable  con  las  tecnologfas  conocidas. 

Es  evidente  que  V  C  AfV.  La  vuelta,  es  decir  la  pregunta  ifP  =  AfVl  es  el  problema 
abierto  mas  importante  en  computacion  teorica  en  la  actualidad,  y  ha  resistido  decadas  de 
esfuerzos.  Resolver  si  V  =  AfV  equivale  a  determinar  que,  dada  una  MTND,  hay  siempre 
una  forma  de  simularla  en  tiempo  polinomial,  o  que  hay  MTNDs  para  las  cuales  eso  no  es 
posible. 

Observation  6.3  Es  interesante  especular  con  las  consecuencias  de  que  V  fuera  igual  a 
AfV.  Hay  muchos  problemas  dificiles  que  se  resuelven  facilmente  en  una  MTND  mediante 
“adivinar”  una  solucion  y  luego  verificarla.  Por  ejemplo,  se  podrian  romper  los  sistemas 
criptograficos  mediante  generar  una  clave  no  determimsticamente  y  luego  correr  el  algoritmo 
(eficiente)  que  verifica  si  la  clave  es  correcta.  Hoy  en  dia  pocos  creen  que  V  pueda  ser  igual  a 
AfV ,  pero  esto  no  se  ha  podido  demostrar.  Pronto  veremos  por  que  todos  son  tan  escepticos. 

Lin  paso  fundamental  hacia  la  solucion  del  problema  es  la  definicion  de  la  clase  de 
problemas  NP-completos.  Para  explicar  lo  que  son  estos  problemas  debemos  comenzar  con 
el  concepto  de  reduction  polinomial. 

Definicion  6.7  Un  lenguaje  L'  C  Eg  reduce  polinomialmente  a  otro  lenguaje  L  C  E*; 
denotado  L'  <  L,  si  existe  una  funcion  f  :  Eg  — >  E*  computable  en  tiempo  polinomial  en 
una  MTD,  tal  que  w  G  L'  <=?  f(w )  G  L. 

Esto  indica  que,  en  cierto  sentido,  L'  no  es  mas  dificil  que  L  (si  todo  lo  polinomial  nos 
da  lo  misrno),  pues  para  resolver  L'  basta  aplicar  /  a  la  entrada  y  resolver  L. 

Lema  6.5  Si  L'  <  L  y  L  eV,  entonces  L'  e  V . 

Prueba:  Para  determinar  si  w  €  Lf  aplico  la  MTD  que  computa  f(w)  (en  tiempo  polinomial 
Tf(\w\)),  y  a  eso  le  aplico  la  MTD  que  decide  L  en  tiempo  polinomial  T(n).  El  tiempo  que  tomara 
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el  proceso  completo  es  Tf(\w\)  +  T(|/(rr)|).  Como  /  se  calcula  en  tiempo  Tf(\w\),  en  ese  tiempo  es 
imposible  escribir  una  salida  de  largo  mayor  a  Tf(\w\),  por  lo  tanto  \  f(w)\  <  |tc|  +  Tf(\w\),  lo  cual 
es  un  polinomio  en  |rc|,  y  tambien  lo  sera  al  componerlo  con  otro  polinomio,  T(-).  □ 

Como  es  de  esperarse,  esta  relation  <  es  transitiva. 

Lema  6.6  Si  L"  <  L'  y  L'  <  L,  entonces  L"  <  L. 

Prueba:  Sea  /  la  reduction  polinomial  de  L"  a  L'  y  g  la  de  L'  a  L.  Sean  Tf(n )  y  Tg(n )  sus 
tiempos  de  computo.  Entonces  h(w)  =  g(f(w))  reduce  polinomialmente  de  L"  a  L.  Por  un  lado, 
w  G  L"  f(w)  G  L'  g(f{w))  G  L.  Por  otro,  el  tiempo  de  aplicar  g(f(w ))  es  Tf(\w\)+Tg(\f(w)\). 
Ya  hemos  visto  en  el  Lema  6.5  que  esto  es  necesariamente  polinomial  en  \w\.  □ 

Los  problemas  NP-completos  son,  en  cierto  sentido,  los  mas  dificiles  dentro  de  la  clase 

MV. 

Definicion  6.8  Un  lenguaje  L  es  NP-completo  si  (a)  L  G  MV ,  ( b )  VI/  G  MV,  L'  <  L. 

El  siguiente  lema  mnestra  en  que  sentido  los  problemas  NP-completos  son  los  mas  dificiles 
de  MV. 

Lema  6.7  Si  L  es  NP-completo  y  L  GP ,  entonces  V  =  MV . 

Prueba:  Sea  un  L'  G  MV .  Como  L  es  NP-completo,  entonces  L'  <  L,  y  si  L  G  V,  por  el  Lema  6.5, 
L'  G  V.  □ 

Observacion  6.4  Esto  signified  que  si  se  pudiera  resolver  cualquier  problema  NP-completo 
en  tiempo  polinomial,  entonces  inmediatamente  todos  los  problemas  MV  se  resolverian  en 
tiempo  polinomial.  Se  conocen  cientos  de  problemas  NP-completos,  y  tras  decadas  de  esfuerzo 
nadie  ha  logrado  resolver  uno  de  ellos  en  tiempo  polinomial.  De  aqui  la  creencia  generalizada 
de  que  V  MV. 

Notese  que  todos  los  problemas  NP-completos  son  equivalentes,  en  el  sentido  de  que 
cualquiera  de  ellos  reduce  a  cualquier  otro.  Pero,  ^corno  se  puede  establecer  que  un  problema 
es  NP-completo?  La  forma  estandar  es  demostrar  que  algun  problema  NP-completo  es  “mas 
facil”  que  cl  nuestro  (el  problema  de  como  se  establecio  el  primer  problema  NP-completo  se 
vera  en  la  proxima  section). 

Lema  6.8  Si  L'  es  NP-completo,  L  G  MV ,  y  L'  <  L,  entonces  L  es  NP-completo. 

Prueba:  Como  L'  es  NP-completo,  L"  <  IJ  para  todo  L"  G  MV .  Pero  L'  <  L,  entonces  por 
transitividad  (Lema  6.6)  L"  <  L.  □ 

Observacion  6.5  En  la  practica,  es  bueno  conocer  un  conjunto  variado  de  problemas  NP- 
completos.  Eso  ayudara  a  intuir  que  un  problema  dado  es  NP-completo,  y  tambien  que 
problema  NP-completo  conocido  se  puede  reducir  a  el,  para  probar  la  NP-completitud.  Si 
un  problema  es  NP-completo,  en  la  practica  no  es  esperable  resolverlo  eficientemente,  por 
lo  que  se  debera  recurrir  a  algoritmos  aproximados,  probabilisticos,  o  meras  heuristicas  para 
tratarlo. 


6.4.  SAT  ES  NP-COMPLETO 


143 


6.4  SAT  es  NP-completo  [AHU74,  sec  10.4] 

Lo  que  hemos  visto  nos  entrega  herramientas  para  mostrar  que  un  problema  es  NP- 
completo  mediante  reducir  a  cl  otro  problema  que  ya  sabemos  que  es  NP-completo.  Pero, 
^corno  obtenemos  el  primer  problema  NP-completo?  No  es  facil,  pues  debemos  demostrar 
que  cualquier  problema  NP  reduce  a  el. 

El  lenguaje  que  elegiremos  como  nuestro  primer  problema  NP-completo  se  llama  SAT. 

Definition  6.9  El  lenguaje  SAT  es  el  de  las  formulas  proposicionales  satisfactibles,  es  decir, 
aquellas  que  es  posible  hacer  verdaderas  con  alguna  asignacion  de  valor  de  verdad  a  sus 
variables.  Permitiremos  los  parentesis,  la  disyuncion  V,  la  conjuncion  A,  y  la  negacion  ~. 
Los  nombres  de  las  variables  proposicionales  seran  cadenas  sobre  algun  alfabeto  de  letras, 
aunque  por  simplicidad  pensaremos  en  letras  individuales  (no  hard  diferencia).  Llamaremos 
literates  a  variables  o  variables  negadas,  conjunciones  a  formulas  de  la  forma  P\  A  ...  A  Pq 
y  disyunciones  a  formulas  de  la  forma  Pi  V  ...  V  Pq. 

Observation  6.6  Si  una  formula  P  tiene  una  cantidad  pequeha  k  de  variables 
proposicionales  distintas,  se  puede  probar  una  a  una  las  2k  combinaciones  de  valores  de 
verdad  y  ver  si  alguna  combinacion  hace  P  verdadera.  El  problema  es  que  k  puede  ser 
cercano  al  largo  de  P,  con  lo  cual  este  metodo  toma  tiempo  exponencial  en  el  largo  de  la 
entrada. 

Ejemplo  6.4  Considere  la  formula 

(p  V  ~  q  V  r)  A  (~  p  V  g  V  ~  r)  A  (~pV~g  V  r )  A  (p  V  ~  q  V  ~  ?’) 

A  (~pV~f/V~r)A(pVg,Vr) 

^Es  satisfactible?  Toma  algo  de  trabajo,  pero  si  lo  es,  con  las  asignaciones  p  =  0,  g  =  0yr  =  l,  o 
p  =  l,  g  =  0yr  =  0  (estamos  escribiendo  1  para  verdadero  y  0  para  falso). 

Para  mostrar  que  SAT  es  NP-completo,  debemos  comenzar  mostrando  que  SAT  G  A fV. 
Esto  es  evidente:  Una  MTND  puede  adivinar  los  valores  a  asignar  a  las  variables  y  luego 
evaluar  la  formula  en  tiempo  polinomial. 

La  parte  compleja  es  mostrar  que  todo  L  G  A fV  reduce  a  SAT.  La  idea  esencial  es  que, 
si  L  G  A fV,  entonces  existe  una  MTND  M  =  (K,  E,  A,s)  que  se  detiene  en  tiempo  p(|tc|) 
o  rnenos  sii  w  G  L,  donde  p(n)  es  un  polinomio.  A  partir  de  M,  w  y  p,  construiremos  una 
formula  proposicional  P  que  sera  satisfactible  sii  M  se  detiene  frente  a  w  en  a  lo  sumo  p(n) 
pasos.  Esta  construction  fM,P(w)  =  P  sera  nuestra  funcion  /,  por  lo  que  debemos  cuidar 
que  P  tenga  largo  polinomial  en  |w|  y  que  se  pueda  escribir  en  tiempo  polinomial. 

La  formula  P  debe  expresar  todo  el  funcionamiento  de  una  MTND,  incluyendo 
afirmaciones  que  nosotros  mismos  hemos  obviado  por  ser  intuitivas.  Comenzaremos  con 
un  par  de  simplificaciones  y  observaciones  para  lo  que  sigue. 
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•  Como  la  MTND  arranca  en  la  configuration  (s,  #w#),  en  p(|w|)  pasos  solo  puede  llegar 
a  la  celda  numero  p'(w)  —  |w|  +  2  +  p(|w|),  el  cual  tambien  es  un  polinomio  en  |w|. 

•  Modificaremos  la  MTND  M  para  qne,  si  llcga  al  estado  h  en  un  paso  anterior  a  p(\w\), 
se  mantenga  en  ese  estado  de  ahf  en  adelante.  De  este  modo  w  €  L  sii  M  esta  en  cl 
estado  h  en  el  paso  p(|w|).  No  es  dificil  de  hacer  esta  modification:  basta  agregar  las 
reglas  ( h ,  a,  h,  a)  a  A,  para  todo  a  £  E  (notar  qne  esto  no  esta  realmente  permitido  en 
cl  formalismo,  pero  lo  podemos  hacer,  inclnyendo  el  estado  h  como  cl  cero). 

Utilizaremos  las  signientes  variables  proposicionales  en  P.  De  ahora  en  adelante 
llamaremos  n  =  |w|,  y  renombraremos  E  =  {1,  2, . . . ,  |E|}  y  K  =  {0,  1,  2, . . . ,  \K\}. 

•  para  cada  1  <  i  <  p'(n),  1  <  j  <  |E|,  0  <  t  <  p(n),  se  interpretara  como  qne 

en  la  celda  i,  en  cl  paso  t,  esta  el  caracter  j. 

•  H(i,  t ),  para  cada  1  <  i  <  p'(n),  0  <  t  <  p(n),  se  interpretara  como  qne  el  cabezal  esta 
en  la  celda  i  en  el  paso  t. 

•  S(k,t),  para  cada  0  <  k  <  \K\,  0  <  t  <  p(n),  se  interpretara  como  qne  la  MTND  esta 
en  cl  estado  k  en  el  paso  t. 

La  cantidad  de  variables  proposicionales  es  0(p'(n)2)  (pues  K  y  E  son  constantes,  siempre 
nos  referimos  al  largo  de  w ).  Como  tenemos  qne  usar  un  alfabeto  fijo  para  los  nombres  de 
variables,  realmente  los  largos  qne  reportamos  a  continuation  deben  multiplicarse  por  algo 
del  tipo  logp^n)  =  O(log  n),  lo  cual  no  afecta  su  polinomialidad. 

La  formula  P  tiene  siete  partes: 

p  =  aabacadaeafag 

cada  una  de  las  cuales  fija  un  aspecto  de  la  computation: 


A:  El  cabezal  esta  exactamente  en  un  lugar  en  cada  paso  de  una  computation. 

A  =  A  U(H(l,t),  H(p'(n),t)). 

0<t<p(n) 

Hemos  usado  la  notation  U  para  indicar  que  uno  y  solo  uno  de  los  argumentos  debe 
ser  verdadero,  es  decir, 


U(x  i,x2,  ...,xr) 


Como  el  largo  de  U  es  0(r2),  el  largo  de  A  es  0(p'(n)3). 
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B:  Cada  celda  contiene  exactamente  un  simbolo  en  cada  paso  de  una  computacion. 

B  =  /\  U(C(i,l,t),  C(i,\n,t)), 

(n) 

0<t<p(n) 


cuyo  largo  es  0(p'(n)2). 

C:  La  MTND  esta  exactamente  en  un  estado  en  cada  paso  de  una  computacion. 

C  =  /\  U(S(0,t),  S(l, S(|AT |, ()), 

0  <t<p(n) 

cuyo  largo  es  0(p'(n)). 

D:  La  unica  celda  que  puede  cambiar  entre  un  paso  y  cl  siguiente  es  aquella  donde  esta  el 
cabezal. 

D  =  f\  (. H(i,t )  V  (C(i,j,t)  =  C(i,j,t  +  1)), 

l<i<p'(n) 

1<J<|E| 

0<t<p(n) 

donde  hemos  abreviado  x  =  y  para  decir  (x  A  y)  V  (~  x  A  ~  y).  El  largo  de  D  es 
0(p'(n)2). 

E:  Recien  aqui  empezamos  a  considerar  la  M  especifica,  pues  lo  anterior  es  general  para 
toda  MT.  En  E  se  especifica  lo  que  ocurre  con  la  posicion  del  cabezal  y  cl  contenido 
de  la  cinta  en  esa  posicion  en  el  siguiente  instante  de  ticmpo,  segun  las  opciones  que 
de  el  A  de  M. 

F  a  (' C{i,j,t )  A  H(i,t)  A  S(k,t))  =► 

V {k,j,ke,be)eA(C(i,je,t  +  1)  A  H(ie,t  +  1)  A  S(ke,t  +  1)), 

i<i<|s| 

0<fc<|X| 

0  <t<p(n) 

donde  x  y  es  una  abreviatura  para  ~  x  V  y.  Los  valores  ;je  e  ig  son  funcion  de  bp 

•  Si  be  e  E,  ie  =  i  y  je  =  bp 

•  Si  bp  —  <3,  =  i  —  1  y  j/>  —  j  Esta  regia  se  agrega  solo  si  i  >  1. 

•  Si  be  =  >,  it  =  i  +  1  y  jt  =  j- 

El  tamano  de  E  es  0(p'{n)2).  Notese  como  aparece  cl  no  determinismo  aqui.  Dada 

una  P  que  afirma  algo  para  cierto  t,  para  el  tiempo  t  +  1  vale  la  disyuncion  de  varias 
posibilidades,  segun  la  MTND. 
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F:  Establece  las  condiciones  en  que  comienza  la  computation. 

F  =  S(s,  0)  A  H(n+2,  0)  A  (7(1,  #,  0)  A  C(i,Wi_ i,0)A  A  CO.#.  0), 

2<i<n+l  n+Ki<p'(n) 

donde  recordemos  que  s,  ff  y  los  wt  son  todos  numeros. 

G:  Establece,  finalmente,  que  M  esta  en  el  estado  h  en  el  instante  p(n). 

G  =  S(h,p(n)). 


Teorema  6.1  sat  es  NP-completo. 

Prueba:  Vimos  que  SAT  G  AfV .  Luego,  mostramos  como  reducir  polinomialmente  cualquier 

L  G  AfV  a  SAT:  Describimos  la  construction  de  una  formula  propositional  P  =  f\ttP{w )  que  dice 
que  existe  una  computation  de  M  que  empieza  en  la  configuration  (s,  fiwff)  y  llega  al  estado  h  en 
el  paso  p(n).  Es  posible  hacer  verdadera  P  (es  decir,  P  G  sat)  sii  M  acepta  w  (es  decir,  w  G  L). 
Asignar  los  valores  de  las  variables  proposicionales  C(i,j,t ),  H(i,t)  y  S(k,t )  equivale  a  decir  que 
computation  elegiremos  que  sea  valida  y  termine  en  el  estado  h.  Si  |u>|  =  n,  |P|  =  0(p'(n)3  log n), 
es  decir  polinomial  en  |rc|,  y  puede  construirse  facilmente  en  tiempo  polinomial.  □ 

Observation  6.7  Esto  signified  que,  si  hallaramos  un  metodo  determimstico  de  tiempo 
polinomial  para  resolver  SAT,  inmediatamente  podriamos  resolver  en  tiempo  polinomial 
cualquier  problema  en  A fV.  Basta  construir  una  MTND  M  que  lo  resuelva,  hallar  el 
polinomio  p(n )  que  acota  el  tiempo  en  que  operara,  construir  la  P  correspondiente  a  partir  de 
M ,  p  y  la  cadena  w  que  nos  interesa  saber  si  esta  en  L,  y  finalmente  determinar  en  tiempo 
polinomial  si  P  es  satisfactible. 

Definition  6.10  Una  formula  proposicional  esta  en  forma  normal  conjuntiva  (FNC)  si 
es  una  conjuncion  de  disyunciones  de  literates,  sat-fnc  es  el  lenguaje  de  las  formulas 
satisfactibles  que  estan  en  forma  normal  conjuntiva. 

Lema  6.9  sat-fnc  es  NP-completo. 

Prueba:  Determinar  si  una  formula  esta  en  FNC  es  simple,  de  modo  que  el  verdadero  problema 
es  saber  si  es  satisfactible.  Ya  sabemos  que  SAT  es  NP-completo,  pero  podrfa  ser  que  este  caso 
particular  fuera  mas  facil.  No  lo  es.  La  formula  P  que  se  construye  para  SAT  esta  practicamente  en 
FNC,  solo  hay  que  redistribuir  algunas  formulas  de  tamano  constante  en  D  y  E.  Por  ejemplo,  en  D, 
debemos  convertir  x  V  (y  =  z),  es  decir,  x  V  (y  A  z)  V  (~  y  A  ~  z),  en  (x  V  y  V  ~  z)  A  (x  V  ~  y  V  z). 
En  el  caso  de  E  la  formula  tambien  es  de  largo  constante  (independiente  de  n).  □ 
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6.5  Otros  Problemas  NP-Completos  [AHU74,  sec  10.5] 

Una  vez  que  tenemos  el  primer  problema  NP-completo,  es  mucho  mas  facil  obtener  otros 
mediante  reducciones.  Veremos  solo  unos  pocos  de  los  muchos  problemas  NP-complctos 
conocidos.  Los  problemas  NP-completos  se  suelen  dibujar  en  un  arbol,  donde  los  nodos  son 
problemas  NP-completos  y  un  nodo  u  hijo  de  v  inclica  que  una  forma  facil  o  conocida  de 
probar  que  u  es  NP-completo  es  reducir  v  a  u.  La  rafz  de  este  arbol  sera  sat-fnc. 


Repasemos  la  metodologi'a  general  para  establecer  que  L  es  NP-completo: 

1.  Mostrar  que  L  G  AfV.  Esto  suele  ser  muy  facil  (jcuando  es  verdad!). 

2.  Elegir  un  L'  NP-completo  para  mostrar  que  L'  <  L.  Esto  puede  requerir  intuition  y 
experiencia,  pero  a  veces  es  muy  evidente  tambien. 

(a)  Disenar  la  transformation  polinomial  /.  Esto  suele  hacerse  junto  con  la  election 
de  L',  y  es  realmente  la  parte  creativa  del  ejercicio. 

(b)  Mostrar  que  /  se  puede  calcular  en  tiernpo  determimstico  polinomial.  Esto  suele 
ser  muy  facil  (jcuando  es  verdad!). 

(c)  Mostrar  que  w  G  L'  /(w)  G  L.  Esto  suele  ser  diffcil,  y  normalmente  va  junto 
con  cl  cliseno  de  la  /.  Notar  la  implication  doble  a  demostrar. 
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Comenzaremos  con  una  restriction  ann  mayor  a  sat-fnc. 

Definition  6.11  3-SAT  es  el  conjunto  de  formulas  proposicionales  satisfactibles  en  FNC, 
donde  ninguna  disyuncion  tiene  mas  de  3  literales. 

Teorema  6.2  3-SAT  es  NP-completo. 

Prueba:  Primero,  3-SAT  £  A fV  ya  que  3-SAT  es  un  caso  particular  de  SAT.  Para  mostrar  que  es 
NP-completo,  veremos  que  sat-fnc  <  3-SAT.  La  reduction  es  como  sigue.  Sea  F  =  F\  A  ...  A  Fq 
la  formula  original  en  FNC.  Transformaremos  cada  Fj  con  mas  de  tres  literales  en  una  conjuncion 
donde  cada  elemento  tenga  la  disyuncion  de  tres  literales.  Sea  Fj  =  aq  V  x 2  V  ...  V  x k,  con  Xj 
literal  (variable  o  variable  negada).  Introduciremos  variables  nuevas  y\  a  yk-3,  y  reemplazaremos 
Fj  por 


F[  =  (xi  V  x2  V  2/1)  A  (~  2/1  V  x3  V  2/2)  A  (~  2/2  V  x4  V  2/3)  A  . . . 

A  (~  Vk-4  V  Xk-2  V  yk-3)  A  (~  yk-3  V  xk-i  V  xk). 

Esta  claro  que  F[  se  puede  construir  en  tiernpo  polinomial  a  partir  de  Fj.  Veamos  ahora  que  la 
transformation  preserva  satisfactibilidad: 

•  Si  F  es  satisfactible,  existe  una  asignacion  de  valores  a  las  variables  que  hace  verdadero  cada 
Fj.  Dentro  de  cada  Fj,  al  menos  uno  de  los  literales  Xj  se  hace  verdadero  con  esta  asignacion. 
Conservemos  esa  asignacion  para  F(,  y  veamos  que  se  puede  asignar  valores  a  los  yi  que  hagan 
verdadera  a  F'.  Digamos  que  3  <  j  <  k  —  2.  Podemos  asignar  yj-2  =  1  y  Uj-i  =  0,  pues 
(~  Uj—2  V  Xj  V  ]Jj-\)  se  mantiene  verdadero.  El  valor  asignado  a  yj-2  hace  verdadera  la 
disyuncion  anterior,  (~  '{Jj-3  V  Xj-\  V  yj-2),  lo  cual  nos  permite  asignar  yj-3  =  1  y  seguir 
la  cadena  hacia  atras.  Similarmente,  el  valor  asignado  a  2/7-1  hace  verdadera  la  disyuncion 
siguiente,  (~  yj-i  V  Xj+ 1  V  yj ),  lo  que  nos  permite  asignar  ijj  =  0  v  continuar  la  cadena 
hacia  adelante.  De  rnodo  que  las  F[  son  satisfactibles  tambien. 

•  Si  F'  =  F[  A. . .  A  Fg  es  satisfactible,  hay  una  asignacion  de  variables  de  F'  que  hace  verdadera 

cada  F'.  Veremos  que  no  es  posible  lograr  eso  si  ninguna  de  las  Xj  se  ha  hecho  verdadera.  Si 
todas  las  Xj  se  han  hecho  falsas,  entonces  2/1  debe  ser  verdadera.  Pero  entonces,  para  hacer 
verdadera  a  (~  y\  V  X3  V  2/2 )  necesitamos  que  2/2  sea  verdadera,  y  asi  siguiendo,  necesitaremos 
finalmente  que  yk-3  sea  verdadera,  con  lo  que  la  ultima  disyuncion,  (~  yk-3  V  Xk-i  V  Xk) 
es  falsa.  □ 

Veamos  ahora  un  problema  NP-completo  que  no  tiene  nada  que  ver  con  formulas 
proposicionales,  sino  con  grafos. 

Definition  6.12  Un  /c-clique  en  un  grafo  no  dirigido  G  =  (V,  E)  es  un  subconjunto  de  V 
de  tamano  k  donde  todos  los  vertices  estan  conectados  con  todos.  El  lenguaje  clique  es  el 
conjunto  de  pares  (G,  k)  tal  que  G  tiene  un  k-clique.  Corresponde  al  problema  de,  dado  un 
grafo,  determinar  si  contiene  un  k-clique. 
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Encontrar  cliques  en  grafos  es  util,  por  ejemplo,  para  identificar  clusters  o  comunidades  en 
redes  sociales,  entre  muchas  otras  aplicaciones.  Lamentablemente,  no  es  facil  hallar  cliques. 

Ejemplo  6.5  El  siguiente  grafo  tiene  un  3-clique,  que  hemos  marcado.  ^Puede  encontrar  otro? 
un  4-clique? 


Teorema  6.3  clique  es  NP-completo. 

Prueba:  Esta  claro  que  CLIQUE  €  A fV:  Una  MTND  puede  adivinar  los  k  vertices  y  luego  verificar 
en  tiempo  polinomial  que  forman  un  fc-clique.  Para  ver  que  es  NP-completo,  mostraremos  que  SAT- 
fnc  <  clique.  Sea  F  =  F\  A  ...  A  Fq  una  formula  en  FNC  y  sea  F,  =  xy  i  V  V  ...  V 
Construiremos  un  grafo  G  =  (V,  E )  que  tendra  un  g-clique  sii  F  es  satisfactible. 

G  tendra  un  vertice  por  cada  literal  de  F,  formalmente  V  =  {( i,j ),  1  <  i  <  q,  1  <  j  <  mi}. 
Y  tendra  aristas  entre  literales  de  distintas  componentes  Fi  y  F que  no  sean  uno  la  negacion  del 
otro,  formalmente  E  =  i  Xij  ^  ~  xi',j'}- 

Esta  claro  que  G  se  puede  construir  en  tiempo  polinomial  a  partir  de  F.  Vearnos  ahora  que  la 
transformacion  es  correcta. 

•  Si  F  es  satisfactible,  podemos  asignar  valores  a  las  variables  de  rnodo  que  tengamos  al  menos 
un  literal  verdadero  x^vu\  en  cada  Ft.  Esos  q  literales  verdaderos  no  pueden  ser  ninguno  la 
negacion  del  otro,  pues  se  han  hecho  verdaderos  todos  a  la  vez.  Como  todos  esos  literales  estan 
en  distintas  componentes  y  no  son  ninguno  la  negacion  del  otro,  los  nodos  correspondientes 
estan  todos  conectados  en  G ,  formando  un  g-clique. 

•  Si  G  tiene  un  g-clique,  los  literales  asociados  a  los  g  nodos  participantes  deben  estar  todos 
en  distintas  componentes  y  no  ser  ninguno  la  negacion  del  otro.  Eso  significa  que  se  pueden 
hacer  verdaderos  todos  a  la  vez,  y  tendremos  un  literal  verdadero  en  cada  E,  con  lo  que  F 
puede  hacerse  verdadera. 

□ 
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Ejemplo  6.6  Tomemos  la  formula  del  Ej.  6.4  y  construyamos  el  grafo  G  asociado  a  ella  (con  una 
columna  por  disyuncion).  Como  aquella  formula  de  6  disyunciones  es  satisfactible,  este  G  tiene  al 
menos  un  6-clique.  Para  evitar  una  rnarana  ilegible,  hemos  considerado  la  asignacion  de  variables 
p  =  1,  q  =  0,  r  =  0,  marcando  los  nodos  que  corresponden  a  literales  verdaderos  (se  hace  verdadero 
al  menos  un  nodo  en  cada  columna),  y  hemos  dibujado  solamente  las  aristas  entre  esos  nodos  que 
hemos  seleccionado  (que  estan  todas  conectadas  con  todas,  de  modo  que  se  forma  necesariamente 
al  menos  un  6-clique). 


Observation  6.8  Notar  que,  para  cualquier  k  fijo,  se  puede  determinar  si  G  =  (V,  E )  tiene 
un  k-clique  en  tiempo  0(nk),  lo  cual  es  un  polinomio  en  |G|.  Esta  solucion,  sin  embargo, 
es  exponencial  en  el  largo  de  la  entrada  cuando  k  es  un  parametro  que  puede  ser  tan  grande 
como  n. 

El  siguiente  problema  tiene  que  ver  con  optimization  de  recursos.  Por  ejemplo,  ^corno 
distribuir  faroles  en  las  esquinas  de  un  barrio  de  modo  que  todas  las  cuadras  esten  iluminadas 
y  minimicemos  el  numero  de  faroles?  Supongamos  que  cada  farol  alumbra  una  cuadra,  hasta 
la  proxima  esquina,  en  todas  las  direcciones.  El  problema  es  facil  si  el  barrio  tiene  un  trazado 
regular,  pero  si  es  arbitrario,  es  sorprendentemente  dificil. 

Definicion  6.13  Un  recubrimicnto  de  vertices  (vertex  cover)  de  tamano  k  de  un  grafo  no 
dirigido  G  =  (V,  E)  es  un  subconjunto  de  k  nodos  de  V  tal  que  para  toda  arista  (u,v)  G  E, 
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al  menos  uno  entre  u  y  v  estan  en  el  subconjunto  elegido.  El  lenguaje  VC  se  define  como  los 
■pares  (G,  k)  tal  que  G  tiene  un  recubrimiento  de  vertices  de  tamano  k. 


Teorema  6.4  vc  es  NP-completo. 

Prueba:  Primero,  VC  €  A fV,  pues  una  MTND  puede  adivinar  los  k  vertices  y  luego  verificar 
en  tiempo  polinomial  que  toda  arista  incide  en  al  menos  un  vertice  elegido.  Para  ver  que  es  NP- 
completo,  probaremos  que  clique  <  VC. 

Esto  es  muy  sencillo.  Sea  E'  el  complemento  de  las  aristas  de  E.  Entonces  V'  es  un  clique  en 
G  =  (V,  E)  sii  V— V'  es  un  recubrimiento  de  vertices  en  G'  =  (V,  E').  Una  vez  que  nos  convenzamos 
de  esto,  es  inmediato  corno  reducir:  Un  G  =  (U,  E)  dado  tendra  un  /c-clique  sii  G'  =  (U,  E')  tiene 
un  recubrimiento  de  vertices  de  tamano  \V\  —  k. 


•  Sea  V  un  clique  en  G.  Sus  nodos  estan  todos  conectados  con  todos.  Si  complementamos 
las  aristas  de  G  para  formar  G' .  ahora  esos  nodos  no  estan  conectados  ninguno  con  ninguno. 
Eso  significa  que  los  dernas  vertices,  V  —  V' ,  cubren  todas  las  aristas  de  G1,  pues  toda  arista 
tiene  al  menos  uno  de  sus  extremos  en  V  —  V'  (es  decir  fuera  de  V'). 

•  Sea  V  —V'  un  recubrimiento  de  vertices  en  G' .  Entonces  ninguna  arista  puede  tener  ambos 
extremos  en  V' .  es  decir,  conectar  dos  nodos  de  V' .  Al  complementar  las  aristas  para  formar 
G,  ahora  todos  los  nodos  de  V'  estan  conectados  entre  si,  formando  un  clique. 


□ 


Ejemplo  6.7  Tomemos  el  grafo  del  Ej.  6.5  y  complementemos  las  aristas.  Como  aquel  grafo  tenia 
un  3-clique  y  el  grafo  tiene  7  nodos,  este  grafo  complementado  tiene  un  recubrimiento  de  vertices 
de  tamano  4  (el  complemento  de  los  nodos  de  aquel  clique).  ^Se  puede  cubrir  todas  las  aristas  con 
3  vertices? 
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Veremos  ahora  un  problema  que  no  tiene  que  ver  con  grafos.  Nuevamente  tiene 
aplicaciones  en  optimization.  Supongamos  que  queremos  tener  todas  las  obras  de  Mozart  en 
CDs,  pero  las  obras  vienen  repetidas  en  los  distintos  CDs  que  estan  a  la  venta.  Claramente 
no  es  necesario  comprarlos  todos  para  tener  todas  las  obras.  ^Cual  es  la  minima  cantidad 
de  CDs  que  necesito  comprar?  Un  problema  ligeramente  mas  complejo  es  el  de  comprar  un 
set  de  productos  a  minimo  costo  dado  un  conjunto  de  ofertas  de  paquetes  de  productos. 

Definition  6.14  Dados  conjuntos  S i,  S2 ,  •  •  • ,  Sn,  un  recubrimicnto  de  conjuntos  (set  cover) 
de  tamano  k  es  un  grupo  de  k  conjuntos  Sn ,  Si2, ,  Sik,  tal  que  Ul  <j<A  =  Ul<i<„5i. 
El  lenguaje  SC  es  el  de  los  pares  ( S  =  {-Si,  S2,  ■ . . ,  Sn},  k)  tal  que  S  tiene  un  recubrimiento 
de  conjuntos  de  tamano  k. 

Teorema  6.5  SC  es  NP-completo. 

Prueba:  Es  facil  ver  que  SC  €  J\fV .  Una  MTND  puede  adivinar  los  k  conjuntos  a  unir,  unirlos  y 
verificar  que  se  obtiene  la  union  de  todos  los  conjuntos.  Para  ver  que  es  NP-completo,  reduciremos 
VC  <  SC. 

La  reduction  es  muy  simple.  Sea  un  grafo  G  =  (V,E).  Asociaremos  a  cada  vertice  v  €  V 
un  conjunto  Sv  conteniendo  las  aristas  que  tocan  v,  formalmente  Sv  =  {(u,u)  €  E}  (recordar 
que  G  no  es  dirigido,  por  lo  que  (u,v)  =  (v,u)).  Evidentemente  esto  puede  hacerse  en  tiempo 
polinomial.  Ademas  no  es  dificil  ver  que  si  {iq,  v2,  ■  ■  ■ ,  v k}  es  un  recubrimiento  de  vertices  de  G, 
SV1 ,  SV2, . . . ,  SVk  es  un  recubrimiento  de  conjuntos  de  S,  y  viceversa.  Lo  primero  dice  que  toda 
arista  tiene  al  menos  un  extremo  en  algun  Vi  y  lo  segundo  que  toda  arista  esta  contenida  en  algun 
SVi ,  y  arnbas  cosas  son  lo  misrno  porque  precisamente  SVi  contiene  las  aristas  que  inciden  en  v\ .  □ 

Ejemplo  6.8  Tomemos  el  grafo  del  Ej.  6.7  y  dibujemos  los  conjuntos  de  aristas  del  problema 
correspondiente  de  SC  directamente  sobre  el  grafo.  Hernos  dibujado  solamente  los  que  corresponden 
a  la  solution  del  VC  en  aquel  ejemplo.  Toda  arista  esta  en  algun  conjunto. 
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Volvamos  a  problemas  en  grafos.  Un  problema  de  optimization  muy  comun  en 
aplicaciones  de  transporte  es  el  de  recorrer  un  conjunto  de  sitios  a  costo  nn'nimo,  cuando 
existe  un  costo  arbitrario  para  ir  de  cada  sitio  a  otro.  El  siguiente  problema  es  una 
simplification  de  este  escenario,  la  cual  ya  es  NP-completa. 

Definition  6.15  Un  grafo  dirigido  G  =  (V,  E)  tiene  un  circuito  hamiltoniano  (Hamiltonian 
circuit)  si  es  posible  partir  de  uno  de  sus  nodos  y,  moviendose  por  aristas,  ir  tocando  cada 
nodo  de  V  exactamente  una  vez,  volviendo  al  nodo  original.  El  lenguaje  HC  es  el  de  los 
grafos  dirigidos  G  que  tienen  un  circuito  hamiltoniano. 

Ejemplo  6.9  ^Tiene  este  grafo  un  circuito  hamiltoniano?  Cuesta  un  poco  encontrarlo,  pero  lo 
tiene:  5, 2, 4, 3, 1,5. 


Antes  de  demostrar  que  HC  es  NP-completo,  estudiemos  el  siguiente  subgrafo: 
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Notese  que,  si  se  entra  por  la  derecha  y  se  sale  por  la  izquierda,  o  viceversa,  siempre 
quedara  un  nodo  excluido  del  potencial  circuito  hamiltoniano.  De  modo  que  en  cualquier 
circuito  hamiltoniano  que  involucre  este  subgrafo,  si  el  circuito  entra  por  la  izquierda  debe 
salir  por  la  izquierda,  y  si  entra  por  la  derecha  debe  salir  por  la  derecha.  Si  entra  por  la 
izquierda,  puede  o  no  tocar  los  nodos  de  la  derecha  (y  viceversa).  Con  esto  estamos  listos 
para  mostrar  que  HC  es  NP-completo. 

Teorema  6.6  HC  es  NP-completo. 

Prueba:  Es  facil  ver  que  HC  €  J\fV:  Una  MTND  puede  adivinar  la  permutation  que  forma  el 
circuito  y  luego  verificar  que  existe  una  arista  entre  cada  nodo  y  el  siguiente  de  la  permutation. 
Para  ver  que  es  NP-completo,  mostraremos  que  VC  <  HC.  Dado  un  par  (G,k),  construiremos  un 
grafo  dirigido  Gd  tal  que  G  tendra  un  recubrimiento  de  vertices  de  tamano  k  sii  Gd  tiene  un 
circuito  hamiltoniano. 

La  construction  es  como  sigue.  Sea  G  =  (V,  E).  Por  cada  nodo  v  €  V  tendremos  una  lista 
de  nodos  en  Gd-  Por  cada  arista  (u,v)  €  E  pondremos  un  par  de  nodos  en  la  lista  de  u  y  otro 
par  en  la  lista  de  v,  formando  el  subgrafo  mostrado  recien  entre  esos  cuatro  nodos.  Finalmente, 
agregaremos  k  nodos  aq,  0,2, ... ,  a*,,  de  los  que  saldran  aristas  al  comienzo  de  cada  una  de  las  V 
listas  y  a  las  que  llegaran  aristas  desde  el  final  de  cada  una  de  las  \V\  listas. 

Esta  claro  que  este  grafo  Gd  se  puede  construir  en  tiernpo  polinomial  en  |G|.  Veamos  ahora 
que  (G,  k )  €  vc  sii  Gd  £  hc. 

•  Si  hay  k  nodos  {ui,  V2,  ■  ■  ■ ,  Vk}  C  V  que  cubren  todas  las  aristas,  el  circuito  en  Gd  pasara  por 
las  listas  que  corresponden  a  los  nodos  elegidos  en  V.  Comenzaremos  por  ai,  luego  pasaremos 
por  la  lista  de  v±,  al  salir  iremos  a  02,  luego  a  la  lista  de  v%,  y  asi  hasta  recorrer  la  lista  de 
Vk  y  volver  a  a\.  Este  circuito  recorre  todos  los  nodos  de  Gd  que  estan  en  las  listas  elegidas. 
^.Que  pasa  con  los  nodos  en  las  listas  no  elegidas?  Estos  aparecen  de  a  pares,  y  corresponden 
a  aristas  que  conectan  los  nodos  no  elegidos  con  nodos,  necesariamente,  elegidos  (pues  los 
nodos  elegidos  cubren  todas  las  aristas).  Entonces,  cada  uno  de  estos  pares  se  puede  recorrer 
en  el  momento  en  que  se  pase  por  el  par  de  nodos  correspondiente  del  vertice  elegido. 

•  Si  Gd  tiene  un  circuito  hamiltoniano,  cada  una  de  las  a*  debe  aparecer  exactamente  una  vez. 
Debe  recorrerse  exactamente  una  lista  luego  de  cada  at.  Esas  k  listas  que  se  recorren  son  las 
de  vertices  que  necesariamente  cubren  todas  las  aristas  de  G,  pues  los  pares  de  nodos  de  las 
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listas  no  elegidas  han  sido  incluidas  en  el  circuito  y  eso  implica  que  los  otros  dos  nodos  que 
les  corresponden  estan  en  listas  elegidas.  □ 

Ejemplo  6.10  Tomemos  un  pequeno  ejemplo  de  recubrimiento  de  vertices  de  tarnano  2,  donde 
{1,3}  es  una  solution.  Hernos  dibujado  el  problema  HC  asociado,  y  el  circuito  que  corresponde 
a  seleccionar  esos  dos  vertices.  Observese  corno  se  pasa  por  los  vertices  de  las  listas  no  elegidas 
cuando  es  necesario  para  incluirlos  en  el  circuito. 
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Otro  problema  importante  en  grafos  es  el  de  colorearlos,  es  decir  asignarle  una  clase 
(de  un  conjunto  finito)  a  cada  nodo,  de  modo  que  nodos  adyacentes  sean  de  distinta  clase. 
Una  aplicacion  elemental  es  colorear  un  mapa,  pero  se  puede  usar  para  modelar  cosas  corno 
distribuir  tareas  en  servidores  de  modo  que  algunas  tareas  (por  consumir  el  mismo  tipo  de 
recursos)  no  deberfan  estar  juntas. 

Definicion  6.16  Un  fc-coloreo  de  un  grafo  no  dirigido  G  =  (V,  E )  es  una  funcion  c  :  V  — » 
[1  ,k\,  tal  que  si  (u,v)  G  E,  entonces  c(u )  ^  c{v).  El  lenguaje  COLOR  es  el  conjunto  de  los 
pares  (G,  k )  tal  que  G  tiene  un  k-coloreo. 

El  problema  es  trivial  para  k  —  1  y  facil  de  resolver  polinomialmente  para  k  —  2  jintentelo !, 
pero  NP-completo  a  partir  de  k  =  3. 

Ejemplo  6.11  Considere  el  grafo  del  Ej.  6.5.  A1  tener  un  3-clique,  esta  claro  que  se  necesitan 
al  menos  3  colores  para  colorearlo.  ^Basta  con  tres?  Toma  algo  de  trabajo  convencerse,  pero  se 
puede.  Una  solucion  es  la  que  sigue. 


Teorema  6.7  COLOR  es  NP-completo. 

Prueba:  Una  MTND  puede  facilmente  adivinar  el  color  a  asignar  a  cada  vertice  y  luego  verificar 
en  tiempo  polinomial  que  no  hay  pares  conectados  del  mismo  color.  Para  ver  que  COLOR  es  NP- 
completo,  mostraremos  que  3-SAT  <  COLOR. 

Supongamos  que  tenemos  una  formula  F  =  F\  A  F2  A  ...  A  Fg,  formada  con  variables 
proposicionales  v±,  V2,  ■  ■  ■ ,  vn.  Supondremos  n  >  4,  lo  cual  no  es  problema  porque  con  cualquier 
n  constante  3-SAT  se  puede  resolver  probando  todas  las  combinaciones  en  tiempo  polinomial.  0 
sea,  si  a  un  conjunto  dificil  le  restamos  un  subconjunto  facil,  lo  que  queda  aun  es  dificil.  Construiremos 
un  grafo  G  =  (V.  E )  que  sera  coloreable  con  n  +  1  colores  sii  F  es  satisfactible. 

G  tendra  los  siguientes  vertices:  (i)  v^,  ~  Vi  y  Xi,  1  <  i  <  n,  donde  las  Vi  son  las  variables 
proposicionales  y  Xi  son  si'mbolos  nuevos,  (ii)  Fj,  1  <  j  <  q.  Las  aristas  conectaran  los  siguientes 
pares:  (a)  todos  los  ( Xi,Xj ),  i  /  j;  (6)  todos  los  ( Xi,Vj )  y  (xi,~  Vj),  i  7^  j\  (c)  todos  los  (uj,~  n,); 
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(d)  todos  los  ( Vi,Fj )  donde  Vi  no  es  un  literal  en  Fy,  (e)  todos  los  (~  Vi,Fj )  donde  ~  V{  no  es  un 
literal  en  Fj. 

La  construccion  no  es  muy  intuitiva,  pero  obviamente  pnede  hacerse  en  tiempo  polinomial. 
Debemos  ver  ahora  que  funciona.  Comencemos  por  algunas  observaciones.  El  n-clique  formado 
por  los  Xi  s  obliga  a  usar  al  menos  n  colores,  uno  para  cada  x*.  A  su  vez,  los  v i  y  ~  vt  no  pueden 
tomar  el  color  de  un  Xj  con  j  A  *•  Si  pueden  tomar  el  color  de  su  x*,  pero  no  pueden  hacerlo 
tanto  Vi  corno  ~  Vi  porque  ellos  tambien  estan  conectados  entre  si.  De  modo  que  uno  de  los  dos 
debe  recibir  un  color  mas,  que  llamaremos  gris  (la  intuition  es  que  un  literal  gris  corresponde  a 
hacerlo  falso).  Hasta  ahora  podemos  colorear  G  con  n  +  1  colores,  pero  faltan  aun  los  nodos  Fj.  Si 
queremos  un  n  +  1  coloreo  debemos  colorear  estas  Fj  sin  usar  nuevos  colores. 

Como  hay  al  menos  4  variables  distintas  y  las  Fj  mencionan  3  literales,  existe  por  lo  menos 
una  variable  Vi  que  no  se  menciona  en  Fj.  Esto  hace  que  Fj  este  conectado  con  Vi  y  con  ~  Vi,  y 
por  ende  no  pueda  ser  coloreada  de  gris.  Los  rinicos  colores  que  puede  tomar  Fj  corresponden  a 
los  literales  (variables  afirmadas  o  negadas)  que  aparecen  en  Fj,  pues  esta  conectada  con  todos  los 
demas.  Si  estos  literales  son  todos  grises,  corno  Fj  no  puede  ser  gris,  se  necesitara  un  color  mas. 
Si,  en  cambio,  alguno  de  ellos  es  de  otro  color,  Fj  podra  tomar  ese  color  y  no  requerir  uno  nuevo. 


•  Supongamos  que  F  es  satisfactible.  Entonces  existe  una  asignacion  de  valores  de  verdad  a 
las  Vi  tal  que  cada  Fj  contiene  un  literal  que  se  hizo  verdadero.  Si  coloreamos  de  gris  a  las  u* 
y  ~  Vi  que  se  hacen  falsas,  y  coloreamos  igual  que  Xj  a  las  Vi  y  ~  Vi  que  se  hacen  verdaderas, 
entonces  cada  Fj  podra  tomar  el  color  no-gris  de  alguna  de  las  Vi  o  ~  Vi  que  aparecen  en  ella. 
Entonces  G  sera  color eable  con  n  +  1  colores. 


•  Supongamos  que  G  se  puede  colorear  con  n  + 1  colores.  Eso  significa  que  podemos  elegir  cual 
entre  Vi  y  ~  Vi  sera  del  color  de  su  xt  (y  la  otra  sera  gris),  de  modo  que  cada  Fj  contendra  al 
menos  un  literal  coloreado  no-gris.  Entonces  se  puede  hacer  falsos  a  los  literales  coloreados 
de  gris,  y  cada  Fj  tendra  un  literal  que  se  haga  verdadero. 


□ 


Ejemplo  6.12  No  nos  sirve  el  Ej.  6.4  porque  solo  tiene  3  variables.  Para  que  nos  quede  algo 
legible,  usaremos  F  =  (p  V  q)  A  (~  p  V  r)  A  (~  q  V  ~  r).  Este  tambien  tiene  3  variables,  pero 
solo  2  literales  por  disyuncion,  de  modo  que  sigue  valiendo  que  hay  alguna  variable  que  no  aparece 
en  cada  Fj.  El  grafo  que  se  genera  para  esta  F  es  el  siguiente.  El  grafo  es  4-coloreable  porque  F 
es  satisfactible,  por  ejemplo  con  p  =  1,  q  =  0,  r  =  1.  Hernos  coloreado  el  grafo  de  acuerdo  a  esa 
asignacion  de  variables. 
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Un  problema  rclevante  de  conjuntos,  parecido  al  recubrimiento  de  vertices,  es  el  de  cubrir 
el  co nj unto  con  subconjuntos  sin  traslapes. 

Definition  6.17  Dados  conjuntos  Si,  S2,  ■ . . ,  Sn,  un  recubrimiento  exacto  (exact  cover) 
es  un  grupo  de  conjuntos  Sh,  S*2, . . . ,  Sik,  tal  que  Ui<j<fc  =  Ui<i<n  Si  y  Sio  n  Sly  =  0 
para  todo  j  7^  j' .  El  lenguaje  EC  es  el  de  los  conjuntos  <S  =  {Si,  S2, . . . ,  Sn}  tal  que  S  tiene 
un  recubrimiento  exacto. 

A  pesar  de  lo  que  podria  esperarse,  la  reduction  mas  fatil  hacia  EC  no  es  desde  SC  sino 
desde  color. 

Teorema  6.8  EC  es  NP-completo. 

Prueba:  Es  facil  ver  que  EC  €  JfV,  pues  una  MTND  puede  adivinar  los  conjuntos  y  luego  verificar 
que  forman  un  recubrimiento  exacto.  Para  mostrar  que  es  NP-completo,  mostraremos  que  COLOR 
<  EC. 

Dada  la  entrada  (G  =  ( V,E),k )  a  COLOR,  generaremos  una  entrada  para  EC  de  la  siguiente 
forma.  Los  conjuntos  de  S  seran  corno  sigue:  (i)  para  cada  v  E  V  y  cada  1  <  i  <  k,  el  conjunto 
Sv,i  =  {u}  U  {(u,v,i),  u  G  V,  (u,v)  G  E},  (ii)  para  cada  (u,v)  &  Eyl<i<k,  el  conjunto 
Su,v,t  =  {(it,  v,  i)}.  La  union  de  todos  los  conjuntos  es  P  U  (Ex  [1,  k]).  Claramente  estos  conjuntos 
se  pueden  construir  en  tiempo  polinomial.  Vearnos  ahora  que  la  transformation  es  correcta. 
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•  Si  es  posible  asignar  colores  c(v)  €  [1  ,k\  a  cada  v  G  V  de  modo  que  no  haya  nodos  del 
mismo  color  conectados,  entonces  es  posible  cubrir  S  exactamente:  elegiremos  los  conjuntos 
SvAv)  para  cada  v,  y  despues  agregaremos  los  SUjVj  que  falten  para  completar  el  conjunto. 
Esta  claro  que  tenemos  todos  los  elementos  de  V  en  la  union  de  estos  conjuntos,  y  tambien 
los  de  £  x  [1 ,  k]  pues  agregamos  todos  los  elementos  ( u,v,i )  que  sean  necesarios.  Por  otro 
lado,  no  hay  intersection  en  los  conjuntos  elegidos:  claramente  no  la  hay  en  los  SUjVji,  y 
no  la  hay  en  ningun  par  SVtC^  y  Sv  c(u\ ,  pues  el  unico  elemento  que  podrfan  compartir  es 
(u,v,c(u))  =  (u,v,c(v)),  para  lo  cual  c(v)  y  c(u)  deben'an  ser  iguales.  Esto  es  imposible 
por  que  u  y  v  son  adyacentes. 

•  Si  existe  un  recubrimiento  exacto,  debemos  haber  elegido  exactamente  un  Slhl  por  cada  v  €  V 

para  poder  cubrir  V.  Si  no  hay  traslapes  entre  estos  conjuntos  es  porque  para  todo  par  de 
nodos  adyacentes  u  y  v,  se  han  elegido  distintos  valores  de  i  (pues  sino  habrfa  un  elemento 
repetido  ( u,v,i )  entre  los  conjuntos).  Podemos  colorear  v  del  color  c(y)  =  i  si  elegimos  SVti, 
y  tendremos  un  /c-coloreo  (sin  nodos  adyacentes  con  el  mismo  color  i).  |-| 

Ejemplo  6.13  Reduzcamos  el  problema  de  3-colorear  el  grafo  del  Ej.  6.11  a  EC.  Los  conjuntos  son 
los  siguientes.  Hemos  ordenado  los  pares  en  forma  consistente,  pues  las  aristas  no  tienen  direction. 


5a, 1 

= 

{a, 

(a,b,  1), 

(a,c,  1),  (a,e,  1)} 

5a, 2 

= 

{a, 

(a,  6, 2), 

(a,c,2),  (a,  e,  2)} 

5a, 3 

= 

{a, 

(a,  b,  3), 

(a,c,3),  (a,e,3)} 

5m 

= 

{b, 

(a,  6, 1), 

(b,e,  1),  (6,  /,  1)} 

Sb,  2 

= 

{b, 

(a,  6,  2), 

(6,e,2),  (6,/, 2)} 

Sb,3 

= 

{b, 

(a,  6, 3), 

(6,  e,  3),  (6,/,  3)} 

Sc,  1 

= 

{c, 

(a,c,  1), 

(c,  d,  1)} 

5c,2 

= 

(c, 

(a,c,  2), 

M,  2)} 

5c,3 

= 

{ti 

(a,c,  3), 

(c,  d,  3)} 

5d,i 

= 

{d, 

(c,  d,  1), 

(d,e,  1),  (d,g,  1),  (d, /,  1)} 

Sd,2 

= 

{d, 

(c,  d,  2), 

(d,  e,  2),  (d,5,2),  (d,  /,  2)} 

£ 

CO 

= 

{d, 

(c,  d,  3), 

(d,  e,  3),  (d,g,  3),  (d,/,3)} 

5e,l 

= 

{P 

(a,e,  1), 

(6,e,l),  (d,  e,  1),  (e, p,  1)} 

5e,2 

= 

{e, 

(a,e,2), 

(6,  e,  2),  (d,  e,  2),  (e, 2)} 

5e,3 

= 

{e, 

(a,e,3), 

(6,  e,  3),  (d,  e,  3),  (e,p,3)} 

Sf,  1 

= 

{/, 

(&,/,!), 

(d,  /,  1)} 

Sf,  2 

= 

{/, 

(b,f,  2), 

(d,  /,  2)} 

CO 

= 

{/, 

(bj,  3), 

(d,  /,  3)} 

Sg,l 

= 

{9, 

(&, 5, 1), 

(d,ff,l),  (e,p,  1)} 

Sg,  2 

= 

{9, 

(b,g,2), 

(d,  g,  2),  (e,0,2)} 

CO 

= 

{9, 

{b,9, 3), 

(d,g,3),  (e,  g,  3)} 
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ademas  de  todos  los  conjuntos  {(x,  y,  i )}  para  cada  arista  (x,  y)  de  E  y  color  1  <  i  <  k.  La  solucion 
correspondiente  al  coloreo  que  hemos  dado,  identificando  el  color  de  a  con  1,  el  de  b  con  2,  y  el  de 
c  con  3,  correspondent,  a  elegir  Sa, i,  Sb, 2,  Sc,3,  5^, 2,  Se )3,  5/q,  59,  1,  mas  todos  los  {(x,y,i)}  que 
falten  para  completar  E  x  {1,2,3}. 

Otro  problema  de  optimizacion  importante,  con  aplicaciones  obvias  a,  por  ejemplo, 
transporte  o  almacenamiento  de  mercancias,  es  cl  de  la  mochila  (tambien  llamado  suma  de 
subconjuntos).  Se  trata  de  ver  si  es  posible  llenar  exactamente  una  mochila  (uni dimensional) 
cligiendo  objetos  de  distinto  tarnano  de  1111  conjunto.  La  version  bidimensional  (mucho  mas 
dificil  intuitivamente)  tiene  aplicaciones  a  corte  de  piezas  en  laminas  de  madera,  por  ejemplo. 

Definicion  6.18  El  problema  de  la  mochila  (knapsack)  es  el  de,  dado  un  multiconjunto 
finito  de  numeros  naturales  y  un  natural  K ,  determinar  si  es  posible  elegir  un  subconjunto 
de  esos  numeros  que  sume  exactamente  K.  El  lenguaje  knapsack  es  el  de  los  pares  ( S,K ) 
tal  que  un  subconjunto  de  S  suma  K . 

Ejemplo  6.14  ^Es  posible  llenar  exactamente  una  mochila  de  tarnano  50  con  objetos  del  conjunto 
(de  tamanos)  {17,  22, 14,  6, 18, 25, 11, 17, 35, 45}?  No  es  facil  encontrar  la  respuesta,  pero  existe  una 
solucion:  22  +  11  +  17. 

Teorema  6.9  knapsack  es  NP-completo. 

Prueba:  Una  MTND  puede  adivinar  el  subconjunto  correcto  y  sumarlo,  por  lo  que  el  problema 
esta  en  J\fV.  Para  ver  que  es  NP-completo,  mostraremos  que  EC  <  knapsack. 

La  idea  es  partir  de  una  entrada  a  EC  S  =  {5i,  52,...,  5™};  con  5  =  Ui <i<nSi  = 
{xo,  xi, . . . ,  xm}.  Identificaremos  cada  elemento  Xj  con  el  numero  2tj",  para  t  =  [log2(n  +  1)]. 
A  cada  conjunto  Si  =  {xq,  Xj2,...,  Xjm. }  le  haremos  corresponder  el  numero  IVj  =  2tn  + 
2tl 2  +  ...  +  2  Umi .  Nuestro  problema  de  knapsack  es  entonces  ({A^i,  N2,...,  Nn},K),  con 
K  =  2° +  2*  +  22t  +  . .  ,  +  2mt.  El  largo  de  la  entrada  a  knapsack  es  0(nmt)  que  es  polinomial  en  |<S|, 
y  no  es  dificil  construir  esta  entrada  en  tiempo  polinomial.  Veremos  ahora  que  la  transformation 
es  correcta. 

•  Supongamos  que  existen  conjuntos  Sq,  Si2,...,  Sik  que  cubren  S  exactamente.  Entonces, 
cada  Xj  aparece  exactamente  en  un  Sir ,  por  lo  que  al  sumar  +  iVj2  +  . . .  +  Nik  el  sumando 
2tj  aparece  exactamente  una  vez,  para  cada  j.  No  hay  otros  sumandos,  de  modo  que  la  suma 
de  los  Nir  es  precisamente  K. 

•  Supongamos  que  podemos  sumar  numeros  +  Ni2  +  . . .  +  Nik  =  K.  Cada  uno  de  los 
terminos  2tj  de  K  se  pueden  obtener  unicamente  mediante  incluir  un  Nir  que  contenga  2tj , 
pues  sumando  hasta  n  terminos  2 tb_1)  se  obtiene  a  lo  sumo  n2tb_1)  =  2hJ_1)+log2n  <  2^. 
Similarmente,  si  incuyeramos  sumandos  7Vj,r  que  contuvieran  un  2tj  repetido,  seria  imposible 
deshacernos  de  ese  termino  2*?+1  que  no  debe  aparecer  en  K,  pues  ni  sumandolo  n  veces 
llegariamos  al  2*b+1)_  por  j0  tanto,  cada  termino  2^  debe  aparecer  exactamente  en  un  7Vjr , 
y  entonces  los  Sir  forman  un  recubrimiento  exacto. 
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Ejemplo  6.15  Tomemos  el  siguiente  problema  de  EC:  {a,  b,  c},  {a,  b,  e},  {b,  d},  {c,e},  {c,  d}, 
que  tiene  solucion  {a,  b ,  e},  {c,  d}.  En  este  caso  n  =  5  y  por  lo  tanto  t  =  3.  Asociaremos  2°  a  a,  2* 
a  b,  y  asi  hasta  24t  a  e.  Es  ilustrativo  escribir  los  mimeros  Nt  en  binario: 


Ni 

=  000  000  001  001  001 

=  73 

n2 

=  001  000  000  001  001 

=  4105 

n3 

=  000  001  000  001  000 

=  520 

n4 

=  001  000  001  000  000 

=  4160 

n5 

=  000  001  001  000  000 

=  576 

I< 

=  001  001  001  001  001 

=  4681 

y  efectivamente  obtenemos  K  =  4681  sumando  N2  +  N§  =  4105  +  576. 

6.6  La  Jerarqma  de  Complejidad  [AHU74,  sec  10.6  y  cap  11] 

Terminaremos  el  capftulo  (y  cl  apunte)  dando  una  vision  superficial  de  lo  que  hay  mas 
alia  en  el  area  de  complejidad  computacional. 

Notemos  que,  en  todos  los  problemas  NP-completos  vistos  en  la  section  anterior,  siempre 
era  facil  saber  que  el  problema  estaba  en  A fV  porque  una  MTND  podia  adivinar  una  solucion 
que  luego  se  verificaba  en  tiempo  polinomial.  Esto  que  se  adivina  se  llama  certificado:  es  una 
secuencia  de  simbolos  que  permite  determinar  en  tiempo  polinomial  que  w  G  L  (por  ejemplo 
la  permutation  de  nodos  para  CH,  el  conjunto  de  mimeros  a  sumar  para  knapsack,  etc.). 
Todos  los  problemas  de  A fV  tienen  esta  estructura:  se  adivina  un  certificado  que  despues  se 
puede  verificar  en  tiempo  polinomial  (esto  es  general:  un  certificado  valido  para  cualquier 
MTND  es  cl  carnino  en  cl  arbol  de  configurations  que  me  lleva  al  estado  en  que  se  detiene 
frente  aw).  El  problema  en  una  MTD  es  que  no  es  facil  encontrar  un  certificado  valido. 

Pero  ^ que  pasa  con  los  complementos  de  los  problemas  que  estan  en  A fVl  Por  ejemplo,  si 
quiero  los  grafos  clirigidos  que  tienen  un  circuito  hamiltoniano,  me  puede  costar  encontrar  el 
circuito,  pero  si  me  dicen  cual  es,  me  convencen  facilmente  de  que  G  G  CH.  Pero  si  quiero  los 
grafos  clirigidos  que  no  tienen  un  circuito  hamiltoniano,  ^que  certificado  me  pueden  mostrar 
para  convencerme  de  que  no  existe  tal  circuito?  ^ Puede  una  MTND  aceptar  los  grafos  que 
no  tienen  un  circuito  hamiltoniano?  ^Los  complementos  de  lenguajes  en  J\fV  estan  en  J\fVl 
Es  intrigante  que  esta  pregunta  no  tiene  una  respuesta  facil,  hasta  el  punto  de  que  se  define 
la  clase  co-A fV  para  represent  ar  estos  problemas. 

Definition  6.19  La  clase  co-A fV  es  la  de  los  lenguajes  cuyo  complemento  esta  enAfV. 

Notese  que  esto  tiene  que  ver  con  la  estructura  asimetrica  de  la  aceptaeion  por  una 
MTND:  acepta  si  tiene  forma  de  aceptar.  Esto  hace  que  sea  diffcil  convertir  una  MTND 
que  acepte  un  lenguaje  L  en  otra  que  acepte  Lc,  incluso  si  estamos  hablando  de  aceptar  en 
tiempo  polinomial.  Esto  no  ocurre  en  V,  cl  cual  es  obviamente  cerrado  por  complemento. 
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Como  los  complementos  de  los  lenguajes  en  V  si  estan  en  V,  tenemos  que  V  C  J\fV  fl  co- 
AfV.  Se  cree  que  A fV  ^  co-A fV  y  que  ambos  incluyen  estrictamente  a  V,  aunque  esto  seria 
imposible  si  V  =  A fV.  Si  A fV  ^  co-A fV,  puede  mostrarse  que  un  problcma  NP-completo  no 
puede  estar  en  co-A fV,  y  un  problcma  co-NP-completo  (que  se  define  similarmente)  no  puede 
estar  en  A fV.  Por  cllo,  si  un  problema  esta  en  A fV  fl  co-A fV,  se  considera  muy  probable 
que  no  sea  NP-completo. 

El  ejemplo  favorito  de  un  problcma  que  estaba  en  A fV  fl  co-A fV  pero  no  se  sabfa  si 
estaba  en  V  era  cl  lenguaje  de  los  primos,  pero  este  se  demostro  polinomial  cl  ano  2004. 

Otra  pregnnta  interesante  es  si  hay  problcmas  que  no  se  sepa  si  son  NP-completos  ni  si 
estan  en  V.  Hay  pocos.  Uno  de  cllos  es  cl  isormorfismo  de  grafos :  Dados  grafos  G  y  G'  del 
misrno  tamano,  determinar  si  es  posible  mapear  los  nodos  de  G  a  los  de  G'  de  modo  qne  las 
aristas  conecten  los  mismos  pares,  (u,v)  G  E  ( f(u ),  f(v))  G  E' . 

Existe  una  clase  natural  que  contiene  a  todas  estas,  y  tiene  que  ver  con  el  espacio,  no  el 
tiempo,  qne  reqniere  una  MT  para  resolver  un  problema.  Llamaremos  D-time  y  A/"D-time  a 
las  clases  V  y  A fV,  para  empezar  a  discutir  el  espacio  tambien. 

Definicion  6.20  La  clase  V -space  es  la  de  los  lenguajes  que  pueden  decidirse  con  una  MTD 
usando  una  cantidad  de  celdas  de  la  cinta  que  sea  un  polinomio  del  largo  de  la  entrada. 

Esta  claro  que  D-time  C  D-space,  pues  una  MTND  no  puede  tocar  mas  celdas  distintas 
que  la  cantidad  de  pasos  que  ejecuta  (mas  las  n  +  2  que  ya  vienen  ocupadas  por  la  entrada, 
pero  eso  no  viene  al  caso).  Mas  aun:  como  la  simulation  de  una  MTND  con  una  MTD 
requeria  espacio  polinomial  en  el  usado  por  la  MTND  (Section  4.5),  resulta  que  A/’D-time 
C  D-space,  y  lo  misrno  co-A/"D-time  (el  cual  no  parece  que  se  pueda  decidir  en  tiempo 
polinomial  con  una  MTND,  pero  si  en  tiempo  exponencial  con  la  simulation  de  la  MTND 
de  la  Section  4.5,  pues  basta  responder  lo  contrario  de  lo  que  responderia  la  simulation 
deterministica).  Sin  embargo,  no  se  sabe  si  D-time  ^  D-space.  Existe  incluso  el  concepto 
de  Pspace-complcto. 

Definicion  6.21  Un  lenguaje  es  P space- completo  si  pertenece  a  V-space  y,  si  es  decidido 
en  tiempo  T(n)  por  una  MTD,  entonces  todo  otro  problema  en  V-space  se  puede  decidir  en 
tiempo  T(p(n))  para  algun  polinomio  p(n). 

Esta  claro  que  si  se  encuentra  una  solution  deterministica  de  tiempo  polinomial  para  un 
problema  Pspace-completo,  entonces  D-time  =  D-space  =  A/"D-time  =  co-A/"D-time.  Esto 
se  ve  aun  mas  improbable  que  encontrar  que  D-time  =  A/"D-time. 

Un  termino  no  demasiado  importante  pero  que  aparece  con  frecuencia  es  NP-hard :  son 
los  problcmas  tales  que  todos  los  A fV  reducen  a  cllos,  pero  que  no  estan  necesariamente 
en  A fV,  de  modo  que  pueden  incluir  problcmas  intratables  incluso  con  una  MTND.  Es 
interesante  que,  a  diferencia  de  lo  que  ocurre  con  D  y  A/"D,  si  es  posible  demostrar  que 
existe  una  jerarquia  estricta  en  tcrminos  de  espacio  y  de  tiempo,  incluyendo  problcmas  que 
demostrablemente  requieren  espacio  y  tiempo  exponencial.  La  mayoria  de  los  problemas 
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interesantes  estan  realmente  en  AfV,  y  no  se  sabe  si  requieren  tiempo  exponencial  en  una 
MTD,  por  eso  la  importancia  del  problema  abierto  ifP  ^  AfV!  Sin  embargo,  podemos 
mostrar  un  problema  relativamente  natural  que  es  efectivamente  dificil. 

Teorema  6.10  El  problema  de  determinar,  dada  una  expresion  regular  R  de  largo  |/?|  =  n, 
si  C(R)  =  E*: 

•  Es  P space- completo  con  los  operadores  usuales  para  expresiones  regulares  (Def.  2.1). 

•  Requiere  espacio  exponencial  en  n  (y  por  lo  tanto  tiempo  exponencial  en  MTD 
o  MTND)  si  permitimos  el  operador  de  interseccion  al  definir  R  (ademas  de  la 
concatenacion,  union  y  clausura  de  Kleene).  Estas  expresiones  regulares  se  llaman 
semiextendidas. 

2n 

22' 

•  Requiere  espacio  superior  a  22  ,  para  cualquier  cantidad  fija  de  2’s,  si  ademas 

de  la  interseccion  permitimos  la  operacion  de  complementar  una  expresion  regular. 
Estas  expresiones  regulares  se  llaman  extendidas  y  esas  complejidades  se  llaman  no 
elementales. 

Prueba:  Ver  [AHU74,  sec  10.6,  11.3  y  11.4].  □ 

La  jerarqma  de  complcjidad  en  espacio  esta  expresada  en  el  siguiente  teorema,  donde 
puede  verse  que  es  bien  fina,  por  ejemplo  se  distingue  espacio  n  del  espacio  n  log  log  n. 

Teorema  6.11  Sean  f(n )  >  n  y  g(n)  >  n  dos  funciones  tal  que  limn _ >00  =  0.  Entonces 

existen  lenguajes  que  se  pueden  reconocer  en  espacio  g(n)  y  no  se  pueden  reconocer  en  espacio 
f(n),  usando  MTDs. 

Prueba:  Ver  [AHU74,  sec  11.1].  □ 

El  resultado  es  ligeramente  menos  fino  para  el  caso  del  tiempo. 

Teorema  6.12  Sean  f(n )  >  n  y  g(n )  >  n  dos  funciones  tal  que  limn _ >OQ  =  0. 

Entonces  existen  lenguajes  que  se  pueden  reconocer  en  tiempo  g(n)  y  no  se  pueden  reconocer 
en  tiempo  f(n),  usando  MTDs. 

Prueba:  Ver  [AHU74,  ejercicios  cap  11]  (no  resueltos),  o  [LP81,  sec  7.7],  para  el  caso  mas  simple 
donde  linp^oo  =  0.  □ 

En  el  caso  de  las  MTNDs  los  resultados  son  bastante  menos  finos:  hay  cosas  que  se 
pueden  resolver  en  tiempo  (o  espacio)  nk+l  pero  no  en  tiempo  nk,  para  cada  entero  k  >  0. 

Esto  implica,  por  ejemplo,  que  existen  problemas  que  se  pueden  resolver  en  tiempo  2” 
en  una  MTD  y  que  definitivamente  no  estan  en  V  (ni  en  AfV).  Notese  que  no  se  sabe  gran 
cosa  sobre  la  relation  entre  espacio  y  tiempo,  mas  alia  de  lo  mencionado:  Todo  lo  que  se 
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pueda  hacer  en  tiempo  T(n)  (determinfstico  o  no)  se  puede  hacer  en  espacio  T(n),  pero  en 
particular  no  se  sabe  rnucho  de  en  que  tiempo  se  puede  hacer  algo  que  requiera  espacio  S(n). 
El  siguiente  esquema  resume  lo  principal  que  hemos  visto. 


Para  terminar,  algunas  notas  practicas.  En  la  vida  real,  uno  suele  encontrarse  con 
problemas  de  optimizacion  mas  que  de  decision.  Por  ejemplo,  no  queremos  saber  si 
podemos  iluminar  el  barrio  con  40  faroles  (vc)  sino  cual  es  el  minirno  mimero  de  faroles 
que  necesitamos.  Normalmente  la  dificultad  de  arnbas  versiones  del  problema  es  la  misma. 
Si  uno  puede  resolver  el  problema  de  optimizacion,  es  obvio  que  puede  resolver  cl  de  decision. 
A1  reves  es  un  poco  mas  sutil,  pues  debo  hacer  una  busqueda  binaria  en  cl  espacio  de  las 
respuestas:  preguntar  si  me  alcanzan  40  faroles;  si  me  alcanzan,  preguntar  si  me  alcanzan  20; 
si  no  me  alcanzan,  preguntar  si  me  alcanzan  30;  y  ash  El  tiempo  se  incrementa  usualmente 
solo  en  forma  polinomial. 

Otro  tema  practico  es:  £que  hacer  en  la  vida  real  si  uno  tiene  que  resolver  un 
problema  NP-complcto?  Si  la  instancia  es  suhcientemente  grande  como  para  que  esto  tenga 
importancia  practica  (normalmente  lo  sera),  se  puede  recurrir  a  algoritmos  aproximados  o 
probabilistic s.  Los  primeros,  para  problemas  de  optimizacion,  garantizan  encontrar  una 
respuesta  suhcientemente  cercana  a  la  optima.  Los  segundos,  normalmente  para  problemas 
de  decision,  se  pueden  equivocar  con  una  cierta  probabilidad  (en  una  o  en  arnbas  direcciones) . 
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Por  ejemplo,  si  la  mitad  de  las  ramas  del  arbol  de  configuraciones  de  una  MTND  me  lleva  a 
detenerme  (o  a  obtener  certificados  validos),  entonces  puedo  intentar  elecciones  aleatorias  en 
vez  de  no  deterministicas  para  obtener  certificados.  Si  lo  intento  k  veces,  la  probabilidad  de 
encontrar  un  certificado  valido  es  1  —  l/2k.  Sin  embargo,  no  sicmpre  tenemos  esa  suerte.  En 
particular,  existe  otra  jerarquia  de  complejidad  qne  se  refiere  a  cnanto  se  dejan  aproximar  los 
problemas  NP-completos.  Algnnos  lo  permiten,  otros  no.  En  los  proyectos  se  dan  algnnos 
pnnteros. 


6.7  Ej  ercicios 

1.  Snponga  que  L i  <  L2  y  qne  V  ^  J\fV.  Responda  y  justifique  brevemente. 

(a)  Si  L i  pertenece  a  V,  lL2  pertenece  a  V‘! 

(b)  Si  L2  pertenece  a  V,  lL\  pertenece  a  V‘! 

(c)  Si  Li  es  A/’P’-Completo,  les  L2  a  A/"P- Complete? 

(d)  Si  L2  es  APP-Completo,  les  Li  a  A/"P- Complete? 

(e)  Si  L2  <  Li,  ^son  Li  y  L2  A/’P-Completos? 

(f)  Si  Li  y  L2  son  APP-Completos,  ^vale  L-2  <  L i  ? 

(g)  Si  Li  pertenece  a  J\fV,  ies  L2  A/’P-Completo? 


2.  Considere  una  formula  booleana  en  Forma  Normal  Disyuntiva  (FND)  (disyuncion  de 
conjunciones  de  literates). 

(a)  De  un  algoritmo  determinfstico  polinomial  para  determinar  si  una  formula  en 
FND  es  satisfactible. 

(b)  Muestre  que  toda  formula  en  FNC  se  puede  traducir  a  FND  (leyes  de  Morgan, 
primer  ano). 

(c)  ^Por  que  entonces  no  vale  que  SAT- FNC  <  SAT-FND  y  V  =  MVl 

3.  Muestre  que  las  siguientes  variantes  del  problcma  CH  tambien  son  NP-completas. 

•  El  grafo  es  no  dirigido. 

•  El  camino  no  necesita  ser  un  circuito  (es  decir,  volver  al  origen),  pero  si  pasar  por 
todos  los  nodos. 

•  El  grafo  es  complete  (tiene  todas  las  aristas)  y  es  no  dirigido,  pero  cada  arista 
tiene  un  costo  c(u,  v)  >  0  y  la  pregunta  es  si  es  posible  recorrer  todos  los  nodos 
(aunque  se  repitan  nodos)  a  un  costo  de  a  lo  sumo  C.  Este  es  cl  problema  del 
ve?idedor  viajero  o  viajante  de  comercio. 
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4.  Use  clique  para  mostrar  que  los  siguientes  problemas  son  NP-complctos. 

•  El  problema  del  conjunto  independiente  maximo  (maximum  independent  set)  es, 
dado  un  grafo  G  =  (V,  E)  y  un  entero  k  <  \V\,  determinar  si  existen  k  nodos  en 
G  tales  que  no  haya  aristas  entre  ellos. 

•  El  problema  de  isomorfismo  de  subgrafos  es,  dados  grafos  no  dirigidos  G  y  G' , 
determinar  si  G'  es  isomorfo  a  algun  subgrafo  de  G.  Un  subgrafo  de  G  se  obtiene 
eligiendo  un  conjunto  de  vertices  y  quedandose  con  todas  las  aristas  de  G  que 
haya  entre  esos  nodos. 

•  El  mismo  problema  anterior,  pero  ahora  podemos  elegir  algunas  aristas,  no 
necesariamente  todas,  al  generar  el  subgrafo  de  G. 

5.  Parta  de  knapsack  para  demostrar  que  los  siguientes  problemas  son  NP-completos. 

(a)  El  problema  de  particion  de  conjuntos  (set  partition)  es,  dados  dos  conjuntos  de 
naturales,  ^es  posible  dividirlos  en  dos  grupos  que  sumen  lo  mismo? 

(b)  El  problema  de  empaquetamiento  (bin  packing)  es,  dado  un  conjunto  de  mimeros  y 
un  repositorio  infinito  de  paquetes  de  capacidad  K ,  ^puedo  empaquetar  todos  los 
items  en  a  lo  sumo  k  paquetes  sin  exceder  la  capacidad  de  los  paquetes?  Reduzca 
de  set  partition. 

6.  El  problema  del  camino  mas  largo  en  un  grafo  no  dirigido  G  es  determinar  si  G  tiene  un 
carnino  de  largo  >  k  que  no  repita  nodos.  Muestre  que  este  problema  es  NP-completo. 

7.  Considere  la  siguiente  solution  al  problema  de  la  mochila,  usando  programacion 
dinamica.  Se  almacena  una  matriz  A[0..n,  0..K],  de  modo  que  A[i,j]  =  1  sii  es 
posible  sumar  exactamente  j  eligiendo  mimeros  de  entre  los  primeros  i  de  la  lista 
Ad,  ?V2,...,  Nn. 

(a)  Muestre  que  A[i  +  1,  j\  =  1  sii  A[i,j]  =  16  A[i,j  —  A?i+1]  =  1. 

(b)  Muestre  que  A  se  puede  llenar  en  tiempo  0(nK )  usando  la  recurrencia  anterior, 
de  modo  de  resolver  el  problema  de  la  mochila. 

(c)  ^Esto  implica  que  V  =  AfVl 

8.  El  problema  de  programacion  entera  tiene  varias  versiones.  Una  es:  dada  una  matriz 
A  de  n  x  rn  y  un  vector  b  de  n  filas,  con  valores  enteros,  determinar  si  existe  un  vector 
x  de  m  filas  con  valores  0  6  1  tal  que  Ax  =  b.  Otra  variante  es  Ax  <  b  (la  desigualdad 
vale  fila  a  fila).  Otras  variantes  pcrmiten  que  x  contenga  valores  enteros. 

(a)  Muestre  que  la  primera  variante  que  describimos  (igualdad  y  valores  de  x  en  0  y 
1)  es  NP-completa  (reduzca  de  knapsack). 
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(b)  Muestre  que  la  variante  que  usa  <  en  vez  de  =  es  NP-completa  (generalice  la 
reduction  anterior) . 

(c)  Muestre  que  la  variante  con  <  y  valores  enteros  para  x  es  NP-completa  (reduzca 
de  la  anterior). 


6.8  Preguntas  de  Controles 

A  continuation  se  muestran  algunos  ejercicios  de  controles  de  anos  pasados,  para  dar  una 
idea  de  lo  que  se  puede  esperar  en  los  proximos.  Hemos  omitido  (i)  (casi)  repeticiones,  ( ii ) 
cosas  que  ahora  no  se  ven,  (in)  cosas  que  ahora  se  dan  corno  parte  de  la  materia  y/o  estan 
en  los  ejercicios  anteriores.  Por  lo  mismo  a  veces  los  ejercicios  se  han  alterado  un  poco  o  se 
presenta  solo  parte  de  cllos,  o  se  mezclan  versiones  de  ejercicios  de  distintos  afios  para  que  no 
sea  repetitivo.  En  este  capftulo  en  particular,  para  el  que  no  existian  guias  previas,  muchas 
de  las  preguntas  de  controles  son  ahora  ejercicios,  por  eso  no  hay  tantas  aqui.  Adernas  este 
capitulo  entro  en  cl  curso  en  1999. 

Ex  2000  Dibuje  una  jerarquia  de  inclusion  entre  los  siguientes  lcnguajes:  aceptables, 
decidibles,  hnitos,  libres  del  contexto,  regulares,  V,  y  J\fV.  Agregue  tambien  los 
complementos  de  los  lcnguajes  en  cada  clase:  los  complementos  de  lcnguajes  hnitos,  los 
complementos  de  lcnguajes  regulares,  etc.  No  confunda  (por  ejemplo)  “complementos 
de  lcnguajes  regulares”  con  “lenguajes  no  regulares”.  jSe  pide  lo  primero! 

Ex  2001  Un  computador  cuantico  es  capaz  de  escribir  una  variable  binaria  con  ambos 
valores  (0  y  1)  a  la  vez,  y  la  computation  se  separa  en  dos  universos  paralelos  que 
no  pueden  comunicarse  entre  si.  Esto  puede  hacerse  repetidamente  para  obtener 
secuencias  de  bits,  subdividiendo  las  computaciones.  Cada  computation  prosigue  en  su 
universo  individual  hasta  que  termina,  El  estado  hnal  del  calculo  es  una  superposicion 
cuantica  de  los  resultados  de  todas  las  computaciones  realizadas  en  paralelo.  Luego, 
con  un  computador  traditional,  es  posible  desentranar  algunos  resultados  en  tiempo 
polinomial.  En  particular  se  puede  descubrir  si  una  determinada  variable  booleana 
esta  en  cero  en  todos  los  resultados  o  hay  algun  1. 

La  construction  real  de  computadores  cuanticos  esta  muy  en  sus  comienzos. 
Suponiendo  que  esto  se  lograra,  responda  las  siguientes  preguntas,  y  si  la  respuesta 
es  si,  indique  que  impacto  practico  tendria  eso  en  el  mundo. 

(i)  /,Se  podria  decidir  algun  problema  actualmente  no  decidible? 

(ii)  iSe  podria  aceptar  algun  problema  actualmente  no  aceptable? 

(iii)  iSe  podria  resolver  rapidamente  algun  problema  A^P-completo? 

Ex  2003  Responda  verdadero  o  falso  a  las  siguientes  ahrmaciones,  justihcando  en  a  lo  sumo 
3  lineas.  Una  respuesta  sin  justification  no  tiene  valor. 
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Sean  P\  y  P2  problemas  (es  decir,  lenguajes). 

(a)  Si  Pi  <  P2  Y  P2  es  NP-completo,  entonces  Pi  es  NP-completo. 

(■ b )  Si  Pi  y  P2  son  NP-completos,  entonces  Pi  <  P2  y  P2  <  Pi. 

(c)  Si  Pi  esta  en  P,  y  P2  <  Pi,  entonces  P2  esta  en  V. 

( d )  Si  Pi  esta  en  J\fV  y  Pi  <  P2,  entonces  P2  esta  en  J\fV . 

(e)  Si  P2  esta  en  A/"P,  Pi  es  NP-completo  y  Pi  <  P2,  entonces  P2  es  NP-completo. 
(/)  Si  Pi  es  NP-completo,  entonces  es  deciclible. 

Ex  2005  Los  extraterrestres  nos  entregan  una  esfera  metalica  qne  recibe  como  entrada  la 
description  de  una  Maquina  de  Turing  M  y  un  input  para  M  (en  tarjetas  perforadas). 
En  rnenos  de  tres  segundos  la  esfera  se  ilumina  de  verde  si  M  se  detiene  frente  a  ese 
input  y  rojo  sino.  La  esfera  carnbia  la  teorfa  de  la  computabilidad,  porque 

(a)  Todos  los  problemas  de  decision  se  vuelven  computables. 

( b )  Todos  los  lenguajes  aceptables  pasan  a  ser  decidibles. 

(c)  Todos  los  lenguajes  decidibles  pasan  a  ser  libres  del  contexto. 

(d)  Todos  los  problemas  de  A fV  pasan  a  estar  en  V. 

En  cada  una  de  las  opciones  indique  si  es  cierto  o  falso,  argumentando. 

Ex  2005  El  profesor  Locovich  descubre  un  algoritmo  polinomial  para  resolver  cl  A;-coloreo. 
Explicpie  paso  a  paso  como  utilizarfa  ese  algoritmo  para  resolver  cl  problema  del  circuito 
hamiltoniano  en  tiempo  polinomial,  con  las  herramientas  que  usted  conoce. 

Ex  2005  Dado  un  conjunto  de  conjuntos  {Si,  S2,  ■  ■  ■ ,  Sn}  y  un  nurnero  1  <  k  <  n,  llamemos 
C  =  SiUS2  ■  ■  .USn.  Queremos  saber  si  existe  un  S  C  C  tal  que  |P|  =  k  y  que  S  contenga 
algun  elemento  de  cada  Si,  para  todo  1  <  i  <  n. 

Demuestre  que  el  problema  es  NP-completo  (hint:  use  vertex  cover). 

Ex  2006  Considere  la  MT  robotizada  del  ejercicio  Ex  2006  del  capftulo  4. 

•  Si  tomaramos  esta  MT  como  un  modelo  valido  de  computation,  ^cambiarfa  cl 
conjunto  de  lenguajes  aceptables?  ^el  de  los  lenguajes  decidibles?  ^el  estatus  de 

•  ^Existen  ejemplos  del  mundo  real  que  se  puedan  asimilar,  con  cierta  amplitud  de 
criterio,  a  este  modelo  de  computation? 

Ex  2007  Una  anciana  regala  sus  joyas  a  sus  dos  hijos,  quienes  tendran  que  repartfrselas  de 
la  forma  mas  equitativa  posible.  Son  n  joyas,  tasadas  en  Vi . . .  vn  pesos. 
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1.  Demuestre  que  el  problema  de  saber  si  los  hijos  se  pueden  repartir  las  joyas  en 
forma  perfectamente  equitativa  es  NP-completo.  Ayuda:  Considere  el  problema 
de  la  mochila  (x\ . .  .xn,  con  surna  K),  agregando  un  clemento  adicional  2 K  — 
Y^!i=ixi-  si  este  nuevo  valor  fuera  negativo? 

2.  Extienda  su  solucion  a  m  >  2  hijos. 

3.  Ahora  que  tiene  que  el  problema  es  NP-completo  para  todo  m,  resulta  que  el 
problema  es  obviamente  polinomial  para  m  =  n.  Explique  esta  incongruencia. 


6.9  Proyectos 

1.  Solo  hcmos  cubierto  un  pequeno  conjunto  de  problemas  NP-complctos 

represent  at  i  vos.  Hemos  dejado  fuera  algunos  muy  importantes.  Es  bueno 

que  de  una  mirada  a  los  cientos  de  problemas  NP-completos  que  se 
conocen.  Puede  ver,  por  ejemplo,  cl  excelente  libro  [GJ03]  o,  en  su  defecto, 

http :  //en .  wikipedia .  org/wiki/List_of  _NP-complete_problems. 

2.  Investigue  sobre  algoritmos  de  aproximacion  para  problemas  NP-completos  (realmente 
de  optimizacion),  y  que  problemas  se  dejan  aproximar.  Una  buena  referenda  es 
[ACG+99].  Tambien  hay  algo  en  [CLRS01,  cap  35]  y  en  [GJ03,  cap  6]. 

3.  Investigue  sobre  algoritmos  probabilfsticos  o  aleatorizados,  en  particular  para  resolver 
problemas  NP-completos,  y  que  problemas  se  dejan  resolver  probabihsticamente.  Una 
buena  referenda  es  [MR95],  y  hay  algo  de  material  en  [HMU01,  sec  11.4]. 

4.  Investigue  mas  sobre  la  jerarqma  de  complcjidad.  Adernas  de  las  referencias  que 
ya  hemos  usado,  [AHU01,  cap  10  y  11]  y  [LP81,  cap  7]  (los  cuales  hcmos  resumido 
solamente),  hay  algo  en  [HMU01,  cap  11],  en  [DW83,  cap  13  a  15],  y  en  [GJ03]. 

5.  Investigue  sobre  tecnicas  para  resolver  en  forma  exacta  problemas  NP-completos,  de 
la  rnejor  forma  posible  en  la  practica.  Una  fuente  es  [AHU83,  sec  10.4  y  10.5]. 
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